返回知識庫

Knowledge

怎樣評估 LLM 應用:由示範走向量產

本日瀏覽 · 0 · 累計瀏覽 · 0
  • 評測
  • 品質
  • 生產
  • MLOps

示範階段可用幾條「金鑰問題」;量產需要更大測試集,涵蓋邊界情況與失敗模式。

分開追蹤:事實正確性、格式正確、語氣合規、延遲與成本——每項有不同量測方式。

線上環境可記錄使用者修正、點讚/投訴與人工覆核比例,作為下一輪迭代依據。

為這篇文章評分(1–5 星)