AWS推出SWE-PolyBench測試基準,更精準評估AI程式代理的多語言開發能力 – iThome