# 資料溯源鏈 — 30+ 公開資料庫

> **Route**: `/methodology/data-provenance`
> **SEO target**: `Taiwan ESG data sources`, `public ESG data provenance`
> **data_asof**: 2026-04-10
> **source**: ghostradar.tw/methodology/data-provenance

---

## Answer Capsule

Ghost Radar 的每一筆資料都可以追溯到來源。我們不做問卷、不收報告、不依賴分析師判斷。所有資料來自超過 30 個台灣政府公開資料庫的 API，涵蓋環境裁罰、勞動違規、財務申報、董監事結構和碳排放等維度。從資料來源到你看到的頁面，每一步都有紀錄。

---

## 為什麼這樣設計

傳統 ESG 資料的最大問題是不透明：

| 問題 | 影響 |
|------|------|
| 問卷填報 | 公司自述，難以驗證 |
| 分析師判斷 | 不同人給不同分數，無法重現 |
| 資料來源不公開 | 使用者無法自行驗證 |
| 更新頻率低 | 年度報告，延遲 6-12 個月 |

Ghost Radar 選擇只使用政府公開資料庫——不是因為政府資料完美（它不完美），而是因為這些資料有三個不可替代的特性：

1. **公開可驗證**：任何人都可以去原始來源確認
2. **法定強制**：公司依法必須申報，不是自願填報
3. **機器可讀**：多數有 JSON API，可以自動化追蹤

---

## 怎麼運作

### 資料來源分類

| 類別 | 主要來源 | 涵蓋範圍 |
|------|---------|---------|
| 交易所與市場揭露 | TWSE ESG 摘要 CSV、MOPS 財務申報、TDCC 持股 | 碳排放、用水、廢棄物、董事會結構、財務報表 |
| 政府執法與法規 | 環境部（裁罰/EMS/EIA/碳盤查）、勞動部（違規）、職安署（職災）、金管會（裁罰）、工程會（黑名單） | 環境裁罰、勞動違規、職災、金融裁罰 |
| 身份與商業登記 | 經濟部 GCIS、data.gov.tw | 公司基本資料、董監事、股利 |
| 司法 | 司法院裁判書開放資料 | 法院判決 |
| 食品安全 | 食藥署 | 食品廣告違規 |
| 公民科技 | Disfactory（CC BY 4.0）、FinMind | 工廠用地違規、財務數據備援 |

### 資料流

```
政府資料庫 API（REST / CSV / session auth）
  ↓ 擷取器（fetcher）
原始 JSON 快照
  ↓ 解析器（parser）
三態判定（populated / confirmed_absent / unknown）
  ↓ 身份比對（GCIS 公司代碼）
衍生資料（裁罰嚴重度、交叉訊號）
  ↓ 評分引擎
Coverage Band + Disclosure Rate + Ghost Flags
  ↓ 發布管道（25 步驟）
使用者介面 / API / CSV 匯出 / 輸出護照
```

### 新鮮度追蹤

每個資料來源都有一份合約，定義了更新頻率和容許的延遲上限：

| 等級 | 標籤 | 來源範例 | 更新頻率 | 逾期警報 |
|:----:|------|---------|---------|---------|
| T1 | 關鍵 | 公司登記（GCIS）、基本資料 | 每日 | > 28 小時 → 最高優先修復 |
| T2 | 重要 | 裁罰紀錄（勞動部/環境部/職安署） | 每週 | > 10 天 → 高優先修復 |
| T3 | 輔助 | ESG 指標（TWSE）、碳權、PDF 管道 | 每月/每季 | > 35 天 → 排入待辦 |

### 降級機制

當主要資料來源失效時，系統按固定順序切換到備援：

```
官方 API → 公民科技鏡像 → 快照快取 → 警報
```

- 證據等級隨來源降級：官方 API = E4 → 備援 = E3 → 快取 = E2
- 使用備援資料的旗標會在介面上標示來源年份和出處
- 關鍵來源（7 個）如果回傳零筆紀錄，評分管道會中斷，不會部署

---

## 跟其他方法的差異

| 面向 | 傳統 ESG 資料 | Ghost Radar |
|------|-------------|-------------|
| 主要來源 | 公司自述報告 + 分析師 | 政府公開資料庫 API |
| 可驗證性 | 需要取得原始報告 | 直接連結到政府資料庫 |
| 更新速度 | 年度 | 每日到每季不等 |
| 缺值處理 | 推算或忽略 | 三態分類（populated / confirmed_absent / unknown） |
| 降級透明 | 不公開 | 每個資料點標示證據等級和來源 |
| 快照保留 | 無 | 90 天完整快照，可回溯比對 |

---

## 限制與免責

- 政府資料庫不等於事實全貌。公司可能有未被政府紀錄的 ESG 作為（正面或負面）。
- 台灣以外的營運據點不在目前的資料覆蓋範圍內。
- 部分資料來源有使用條款限制（如司法院裁判書），Ghost Radar 採用 fail-closed 策略處理。
- 資料來源的 API 規格可能變更（schema drift），系統會偵測並暫停自動處理，等待確認後才繼續。
- 快照保留期為 90 天。超過 90 天的歷史資料需從 git 版本控制中取得。

---

## 常見問題

**Q: Ghost Radar 的資料跟公司自行發布的 ESG 報告有什麼關係？**
A: Ghost Radar 不讀取公司的 ESG 報告。我們使用的是政府在接收公司依法申報的資料後，透過公開 API 釋出的版本。這確保了資料的獨立性和可驗證性。

**Q: 為什麼不直接讀取公司的年報？**
A: 年報是非結構化文件，不同公司格式不同，難以自動化提取和比對。政府資料庫已經把法定申報內容結構化了，我們直接使用結構化的版本。

**Q: 如果政府資料庫出錯怎麼辦？**
A: Ghost Radar 有更正機制（Correction Flywheel）。如果使用者發現資料與事實不符，可以提交更正，附帶可追溯的證據來源。

**Q: 資料更新頻率是多少？**
A: 取決於資料來源。公司登記（GCIS）每日更新。裁罰紀錄每週到每月。ESG 指標（TWSE 摘要 CSV）每季。每個來源的更新頻率和最後更新時間都在合約中追蹤。

---

## 引用格式

```
Ghost Radar. "資料溯源鏈." ghostradar.tw/methodology/data-provenance.
Accessed [DATE]. Data as of 2026-04-10.
```


---

## 免責聲明

本平台為留痕觀測基礎設施，非 ESG 評級、非投資建議。
所有觀察基於政府公開資料，不代表公司 ESG 表現的好壞。
結論由使用者自行判斷。

source: https://ghostradar.tw/methodology/data-provenance
machine-readable: https://ghostradar.tw/methodology/data-provenance/md
