site logo: www.epochtimes.com

国科会投入逾2亿 打造台版初代AI对话引擎

国科会14日举办“TAIDE计划第一阶段成果说明记者会”,展示初代可信任人工智慧对话引擎(TAIDE)7B模型。(侯骏霖/大纪元)
人气: 78
【字号】    
   标签: tags: , , ,

【大纪元2023年06月14日讯】(大纪元记者侯骏霖台湾台北报导)ChatGPT等生成式AI蔚为风潮,尤其中国百度发展“文心一言”聊天机器人,可能符合对岸论述,因此打造可信任的台版AI模型格外重要。国科会主委吴政忠14日表示,国家推动的AI模型必须让人信任,会极力减少造成偏见,台湾是民主自由国家的好伙伴,此次已投入经费约新台币2亿元,预计下半年将释出更大模型。

国科会14日举办“TAIDE计划第一阶段成果说明记者会”,展示可信任人工智慧对话引擎(TAIDE)7B模型,将以台湾文化为基底,融入在地语言、价值观、风俗习惯等元素,初步能执行自动摘要、翻译文本、写信及写文章等四项应用。

随着英文、简体中文版聊天机器人陆续问世,国科会主委吴政忠指出,由于AI有坚实的软硬体需求,台湾可以结合半导体制造优势,与全球竞逐、打国际杯,TAIDE主要以正体中文为主,计划经费约新台币2亿元至3亿元。

吴政忠说,下一阶段,预计年底可展示具备“阻绝产生不适当回应”能力的13B大模型,并释出给合作伙伴开发。他说,TAIDE也希望提供一个可以让政府、业者,继续发展其专属的内部应用系统或加值服务,百花齐放。

TAIDE计划学界顾问、阳明交大应数系教授李育杰指出,台版生成式对话引擎的7B初代模型,意即参数量为70亿,在LLaMA(Meta推出的语言模型)原型基础上,由国内学界专家进一步发展及训练调校。

李育杰认为,利用网路爬虫技术找出的现代用语并不合适,优质语料库及资料授权使用也是一大问题,国家队希望后续能产出多项SOP成为典范;尽管目前ChatGPT为175B,所使用的资料、复杂程度更高,但一般13B就已够用,参数量过大反而有负担。

“生成式AI的挑战聚焦在人才培育、AI算力、资料品质”,李育杰提醒,未来对话引擎如应用在金融、司法单位就要更小心,政府单位与业者不能完全倚赖AI模型的直接产出,一定要有专业人士进行把关。另预计今年10月过后,国网中心增设H100 GPU会有更好算力,届时将为经费使用高峰。

TAIDE计划分为四个阶段,第一阶段是包含自动摘要、翻译文本、写信及写文章等四大功能,为中模型;第二阶段则要处理认识台湾、台湾考试、事实查核等任务,为大模型;第三阶段要阻绝不是当回应,例如要能保护个资、符合台湾现行法规论述;第四阶段要能展示多轮问答,让前三阶段应用更完善。

责任编辑:吕美琪

评论