跳至主要內容
方法論

版本與可重現性

Versioning & Reproducibility

SCORING_VERSION: 3 · DATASET_SNAPSHOT_ID: 2026-03-01

Production Repro Meta

patch_id: unknown

git_sha: unknown

spec_version_id: unknown

generated_at: unknown

Scoring Engine

v3

Dataset Snapshot

2026-03-01

版本歷史

評分引擎的主要版本演進紀錄。

v12026-01

初版

  • 5 維度加權計分(Transparency 維度為 null)
  • 基礎公開訊號檢測(如無第三方確信、永續報告無確信、政府裁罰紀錄)
  • CSV 靜態資料,手動更新
v22026-02

確信門檻 + 雜訊抑制

  • 導入 Assurance Gate Multiplier(none=0.55x, limited=0.85x, reasonable=1.0x)
  • Noise Breaker 機制(正負 1.5 分隨機擾動)
  • 擴充至環境/社會/治理公開訊號,涵蓋確信機構與簽證同集團等情境
  • 新增 Evidence 分級系統(E2~E5)與 SHA-256 hash
v32026-03current

多源交叉驗證 + 自動化 Pipeline

  • 15 項政府公開資料來源(source_registry_fin.json)
  • Source Enrichment 自動合併裁罰/環境/勞動資料
  • Release Pipeline 自動產出 snapshot + SHA-256 hash
  • Supabase 即時資料層 + CSV 雙備援
  • 月快照 + 週重算 + 日檢查 cron 機制

Release Pipeline

每次評分更新都經過以下五個階段,確保產出品質。

1

資料蒐集

從 15 個政府公開資料來源自動抓取最新資料

2

品質檢查

比對欄位完整性、格式正確性、時效性(72 小時過期門檻)

3

計分

以 v3 引擎計算 5 維度分數、觸發 Ghost Flags、產生 Evidence

4

發布

產出 Release Snapshot,所有檔案附 SHA-256 雜湊值

5

驗證

任何人可用同一份資料 + 同一版引擎重跑,驗算結果一致

可重現原則

同一份資料 + 同一版引擎 = 同一結果

Ghost Radar 的每一次評分皆可獨立重現。我們公開評分引擎版本、資料快照 ID、與完整的計算邏輯。 任何人都可以下載同一版本的資料與引擎,重跑 pipeline,驗證產出結果完全一致。

驗證機制

Ghost Radar 的每一次評分產出皆可獨立驗證。

Snapshot + SHA-256

每次 release 產出完整資料快照,所有檔案皆附 SHA-256 雜湊值,確保資料完整性。

歷史回溯

可回溯驗證任何歷史輸出——每個快照記錄評分引擎版本、資料來源版本與產出時間戳。

開源可檢視

所有評分模型、權重參數、觸發條件皆開源。任何人可重跑 pipeline 驗算結果。

最新 Release

Release / Snapshot ID

2026-03-01

Scoring Version

1.0

Build Date

2026/3/1

Universe Size

1,957

Artifact Count

16

Dataset Snapshot

2026-03-01

SHA-256 Hashes

FileSHA-256
changelog.mdc1c873b85afd50f4...
changelog.jsonc136b8422af737d2...
repro_appendix.json5c6c9f92beff5077...
field_source_matrix.jsonfe4692c97a69f5a1...
identity_mapping.json47e1bc263fa0ffc0...
openapi.yaml635ae61a6532196f...
dataset_cards.md538367a4fe90e67f...
market_stats_pack.json70059107551f24af...
downloads/ranking.csvcb82669415fd4a0a...
downloads/company_core.csvb46d0e71f89e190e...
downloads/flags.csv2cb801e0972f0d53...
alerts_digest.json4db15474d4ec7a94...
data_quality_report.jsonbad7660a7f236d85...
finance_metrics.csv9a04d5ac0f255153...
neighbors.jsonla3381b8ea34d1cf5...
compare_schema.json945e07766e206e4e...
assurance_provider_stats.json36d79e0f73f16e2b...
correction_report.json2c1353ae1fa2b5d5...

快照歷史

2026-03latest

2026/3/10 上午5:32:24 · 1,957 companies

C.1 關鍵指標(Headline Metrics)

以下三項指標為 Ghost Radar Phase 0 對外引用的核心數字。

無第三方確信比例

No Assurance Rate

0.0%

公式

COUNT(has_assurance=false) / COUNT(*) = 0 / 0

口徑

TWSE+TPEx,不含興櫃/TDR/ETF

分母定義

全部掃描公司 N=0

快照資訊

snapshot: 2026-03-01 · v3

確信機構同集團比例

有確信公司中,確信機構與簽證同集團的比例

0.0%

公式

COUNT(gf014=true) / COUNT(has_assurance=true) = 0 / 0

口徑

TWSE+TPEx,分母限定有確信公司

分母定義

有確信公司 N=0(has_assurance=true)

快照資訊

snapshot: 2026-03-01 · v3

總掃描公司數

Universe Size

0

公式

COUNT(*) WHERE market_type IN (0, 1)

口徑

排除興櫃(market_type=2)、TDR、ETF

來源

MOPS 公開資訊觀測站(SRC-MOPS)

快照資訊

snapshot: 2026-03-01 · v3

C.2 驗算式

以下 SQL 可直接對 Supabase 或本地 scores_v2.csv(匯入 SQLite)執行驗算。

— 無確信比例 —

-- 無第三方確信比例(口徑:TWSE+TPEx)
SELECT
  COUNT(CASE WHEN has_assurance = false THEN 1 END) AS no_assurance_count,
  COUNT(*) AS total_listed,
  ROUND(
    100.0 * COUNT(CASE WHEN has_assurance = false THEN 1 END) / COUNT(*),
    1
  ) AS no_assurance_pct
FROM company_scores
WHERE market_type IN ('0', '1')  -- 上市=0, 上櫃=1,不含興櫃
  AND scoring_run_id = :latest_run_id;
-- Expected: ~58% as of 2026-03-01

— 確信機構同集團比例 —

-- 確信機構與簽證同集團比例(分母:有確信公司)
SELECT
  COUNT(CASE WHEN gf014_triggered = true THEN 1 END) AS gf014_count,
  COUNT(*) AS has_assurance_count,
  ROUND(
    100.0 * COUNT(CASE WHEN gf014_triggered = true THEN 1 END) / COUNT(*),
    1
  ) AS gf014_pct
FROM company_scores
WHERE market_type IN ('0', '1')
  AND has_assurance = true      -- 分母限定有確信公司
  AND scoring_run_id = :latest_run_id;

— 總掃描公司數 —

-- 總掃描公司數(口徑:TWSE+TPEx)
SELECT COUNT(*) AS universe_size
FROM companies
WHERE market_type IN ('0', '1')
  AND entity_type NOT IN ('TDR', 'ETF');
-- Expected: 0 as of 2026-03-01

C.3 口徑對齊檢查清單

引用上述數字時,請確認以下項目皆對齊:

口徑定義:TWSE(市場別=0)+ TPEx(市場別=1),排除興櫃(2)、TDR、ETF

資料截止日(data_asof)與 DATASET_SNAPSHOT_ID 已於每個 metric 標注

計算公式為純整數除法(COUNT/COUNT),結果四捨五入至小數點後一位(百分比)

分母定義差異:無確信比例分母為全部掃描公司;同集團比例分母為有確信公司

has_assurance 欄位使用 true/false 字串(CSV)或 boolean(Supabase),已統一轉換

gf014_triggered 欄位來源:assurance_provider 與 audit_firm 字串比對(Phase 0 代理)

scoring_version 與 dataset_snapshot_id 已嵌入每個 metric,可供快照比對

任何人可使用驗算式於 scores_v2.csv 或 Supabase 自行重算驗證