Knowledge怎樣評估 LLM 應用:由示範走向量產2026-04-01本日瀏覽 · 0 · 累計瀏覽 · 0評測品質生產MLOps示範階段可用幾條「金鑰問題」;量產需要更大測試集,涵蓋邊界情況與失敗模式。分開追蹤:事實正確性、格式正確、語氣合規、延遲與成本——每項有不同量測方式。線上環境可記錄使用者修正、點讚/投訴與人工覆核比例,作為下一輪迭代依據。為這篇文章評分(1–5 星)12345