JSON 轉 TSV 轉換器
最安全的表格格式:將 JSON 轉換為無逗號衝突的 TSV 檔案
為什麼需要將 JSON 轉成 TSV?
雖然 CSV 是最常見的表格格式,但它有一個致命弱點:「如果資料裡本來就有逗號怎麼辦?」(例如地址 Taipei, Taiwan 或文章句子)。這時候 CSV 解析器容易混淆,導致欄位錯位。
TSV (Tab-Separated Values) 使用鍵盤上的 Tab 鍵 來分隔欄位。因為一般文字內容極少使用 Tab,所以 TSV 被視為比 CSV 更「強壯」的格式。這款 JSON 轉 TSV 轉換器 能將複雜的 JSON 資料攤平,轉換為這種適合機器讀取、且不易出錯的格式。
核心原理:隱形的分隔線
轉換過程將 JSON 的巢狀結構「壓扁」,並用 \t (Tab) 取代 , (Comma)。
-
鍵 (Key) ⮕ 標題列: JSON 物件的所有屬性名稱會變成第一行標題。
-
值 (Value) ⮕ 內容列: 屬性對應的值會依序填入。
-
分隔符號:
-
CSV:
Name, Address->John, "Taipei, Taiwan"(需要引號保護)。 -
TSV:
Name[Tab]Address->John[Tab]Taipei, Taiwan(完全不需要引號,乾淨俐落)。
-
常見的應用場景
1. 資料庫匯入 (PostgreSQL COPY)
PostgreSQL 的 COPY 指令在匯入大量數據時,預設或建議使用 TSV 格式。
-
因為它處理特殊字元與換行的能力比 CSV 更好。
-
先將 JSON 轉為 TSV,能大幅提高資料遷移的成功率與速度。
2. NLP 與機器學習資料集
AI 工程師在訓練模型時,訓練資料往往是大量的文本(對話、文章)。
-
這些文本充滿了標點符號與逗號。
-
使用 TSV 格式儲存訓練集,可以避免 Python Pandas 讀取時發生解析錯誤 (ParserError)。
3. 跨平台資料交換
當您需要在 Windows Excel 與 Linux 伺服器之間交換數據時。
-
TSV 是一種「最大公約數」格式,幾乎所有的試算表軟體與程式語言都能完美支援,且較少發生編碼與分隔符號的相容性問題。
常見問題 (People Also Ask)
Q1:Excel 可以打開 TSV 檔嗎?
可以。
-
雖然 Excel 預設關聯是 CSV,但您可以直接將
.tsv檔案拖進 Excel。 -
或者使用「資料 -> 從文字檔匯入」,並在分隔符號選項中勾選 "Tab" 即可完美顯示。
Q2:巢狀物件 (Nested Objects) 會消失嗎?
不會,但會被攤平。
-
例如
{ "user": { "id": 1, "name": "Bob" } }。 -
轉換後通常會變成兩個欄位:
user.id和user.name。 -
這樣可以確保所有資料都被保留下來,同時適應二維表格的結構。
Q3:為什麼複製出來的內容看起來沒對齊?
這是視覺誤差。
-
Tab 鍵在不同編輯器(如記事本 vs VS Code)顯示的寬度不同。
-
雖然肉眼看像沒對齊,但對電腦來說,Tab 的數量是正確的,程式讀取完全沒問題。
Q4:TSV 檔案比 CSV 大還是小?
通常差不多,甚至略小。
-
因為 TSV 不需要像 CSV 一樣為了避開逗號而加上大量的雙引號
""。 -
在處理大量文字資料時,TSV 反而更節省空間。