国科会投入逾2亿打造台版初代AI对话引擎

国科会14日举办“TAIDE计划第一阶段成果说明记者会”，展示初代可信任人工智慧对话引擎（TAIDE）7B模型。（侯骏霖／大纪元）

人气: 83

【字号】大中小

更新: 2023-06-14 9:07 PM 标签: AI, 吴政忠, 国科会, 聊天机器人

【大纪元2023年06月14日讯】（大纪元记者侯骏霖台湾台北报导）ChatGPT等生成式AI蔚为风潮，尤其中国百度发展“文心一言”聊天机器人，可能符合对岸论述，因此打造可信任的台版AI模型格外重要。国科会主委吴政忠14日表示，国家推动的AI模型必须让人信任，会极力减少造成偏见，台湾是民主自由国家的好伙伴，此次已投入经费约新台币2亿元，预计下半年将释出更大模型。

国科会14日举办“TAIDE计划第一阶段成果说明记者会”，展示可信任人工智慧对话引擎（TAIDE）7B模型，将以台湾文化为基底，融入在地语言、价值观、风俗习惯等元素，初步能执行自动摘要、翻译文本、写信及写文章等四项应用。

随着英文、简体中文版聊天机器人陆续问世，国科会主委吴政忠指出，由于AI有坚实的软硬体需求，台湾可以结合半导体制造优势，与全球竞逐、打国际杯，TAIDE主要以正体中文为主，计划经费约新台币2亿元至3亿元。

吴政忠说，下一阶段，预计年底可展示具备“阻绝产生不适当回应”能力的13B大模型，并释出给合作伙伴开发。他说，TAIDE也希望提供一个可以让政府、业者，继续发展其专属的内部应用系统或加值服务，百花齐放。

TAIDE计划学界顾问、阳明交大应数系教授李育杰指出，台版生成式对话引擎的7B初代模型，意即参数量为70亿，在LLaMA（Meta推出的语言模型）原型基础上，由国内学界专家进一步发展及训练调校。

李育杰认为，利用网路爬虫技术找出的现代用语并不合适，优质语料库及资料授权使用也是一大问题，国家队希望后续能产出多项SOP成为典范；尽管目前ChatGPT为175B，所使用的资料、复杂程度更高，但一般13B就已够用，参数量过大反而有负担。

“生成式AI的挑战聚焦在人才培育、AI算力、资料品质”，李育杰提醒，未来对话引擎如应用在金融、司法单位就要更小心，政府单位与业者不能完全倚赖AI模型的直接产出，一定要有专业人士进行把关。另预计今年10月过后，国网中心增设H100 GPU会有更好算力，届时将为经费使用高峰。

TAIDE计划分为四个阶段，第一阶段是包含自动摘要、翻译文本、写信及写文章等四大功能，为中模型；第二阶段则要处理认识台湾、台湾考试、事实查核等任务，为大模型；第三阶段要阻绝不是当回应，例如要能保护个资、符合台湾现行法规论述；第四阶段要能展示多轮问答，让前三阶段应用更完善。

责任编辑：吕美琪

国科会投入逾2亿 打造台版初代AI对话引擎

热门排行

台湾之光

即时新闻

国科会投入逾2亿打造台版初代AI对话引擎