|
蓝委柯志恩。(中评社 俞敦平摄) |
中评社台北11月11日电(记者 俞敦平)中国国民党籍“立委”柯志恩今日在“立法院”教育及文化委员会质询“中研院”院长廖俊智,质疑当前“中研院”所使用的大部分数据来源来自中国大陆,认为“中研院”应加强台湾繁体中文语料库建设,才能在全球语言模型竞争中保持地位。廖俊智回应,表示“中研院”已意识到此问题,并承诺加强中文语料库的扩展与优化,以支持台湾的语言技术发展需求。
“中研院”长廖俊智11日应“立法院”教育及文化委员会邀请列席报告业务概况并备质询。
柯志恩首先指出,当前“中研院”所使用的AI训练资料大部分数据来源来自中国大陆,使得所研发的AI模型在面对台湾在地语言需求时显得不足。柯志恩进一步指出,简体中文在全球AI语料的比例已达16%,而繁体中文仅占0.05%,使得在全球语言模型中,繁体中文的存在感相对薄弱。
|