AI时代芯片禁令对中国AI企业的影响（1）

OpenAI被认为代表了人工智慧最前沿的技术。图为一部智能手机上显示着OpenAI研究实验室的徽标。(Marco Bertorello/AFP via Getty Images)

更新 2024-01-12 8:57 AM 人气 1011

【大纪元2024年01月11日讯】（大纪元记者李圆明采访报导）中国正在进行“百模”大战，但业界认为，人工智能大模型竞争即将“洗牌”，估计活下来的不多。在美国祭出AI芯片禁令之后，中国AI企业的前景将会如何？为此大纪元采访了相关领域的专家。

近年来AI产品层出不穷，引发新一轮投资热。拥有二十多年从业经验的人工智能专家Jason Ma博士将AI大模型及其产品分为两类，即专用型模型和通用型模型。

所谓专用型模型，比如Google Translation（谷歌翻译）、Microsoft的Text-to-speech（文字转声音），可以专门实现某个功能。它基于AI深度学习的技术，完成非常专一的任务，这就是专用型的人工智能模型。

一些大语言模型，比如OpenAI公司开发的GPT3.5和GPT4，它可以完成所有跟语言相关的一切工作，包括全世界100种语言来回转换，同时把人的语言转成计算机语言，包括C语言、Python语言等等。同时，它可以写作，做数学，编程，甚至有很多其它的脑力激荡（Brainstorm）。它就具备了一些通常的知识和能力，这就变成了一个通用型人工智能的概念。

“通用型的模型就像是一个通才。我想让这个模型专门在医疗方面特别强，就用医疗领域的知识再去把那个模型优化一下，就像是人上完General Education（基础教育）以后，再去学些专业知识，变成某个专业的人士。但是它还是基于这种通用模型的概念，只是稍微强化学习了某个方向，医疗方向或者说是法律方向等等。”Jason博士说。

他认为，与Google通过Search（搜索）获取信息的途径不同，ChatPGT是通过聊天、问答的方式提供用户想要的信息。其实人类在出现互联网之前，人和人之间的交往聊天能获得信息量的70%。

生成性模型在模仿人脑

1997年，IBM的电脑“深蓝”击败俄籍世界国际象棋冠军加里‧卡斯帕罗夫。2016年，阿尔法围棋（AlphaGo）击败围棋世界冠军、职业九段棋手李世石，以4比1的总比分获胜。

Jason介绍说，围棋是人类最最复杂的一个游戏，几年前AlphaGo用的技术还是老一代的技术，通常都是深度学习，加上强化学习。像ChatGPT这些生成文字、图像、视频、音乐的等等生成性模型，是基于2017年一个新的深度神经网络结构Transformer（变换器），模仿人大脑的很多部分在做事情。

“从大语言模型的概念来说，现在最好的模型是OpenAI的GPT4，它把几乎整个Internet（互联网）的内容放到模型里训练，另外，它的模型尺寸很大，大概有数以千亿的参数。换句话说，GPT4模型的复杂度已经接近人脑的程度。”

他举例说，人脸识别是老一代的人工智能，就是专用型的人工智能。它是基于一个神经元的深度学习的网络，然后专门建立一个人脸识别的技术。无人驾驶也用到了专用型的人工智能，但是它需要一个比较复杂、多模态的一种状态，各种Sensor（传感器）、Autopilot（自动驾驶仪）等等。

“如果把人工智能想像成一个大脑的话，其实这种自动驾驶其实就是一个人在驾驶，所以它不光是要有大脑，还要有眼睛（摄像头，Camera），要有手控制等等一系列其它辅助的功能。当然大脑是其中比较核心控制的部分。”

芯片对于中国AI企业的影响

2022年10月以来，美国不断收紧对华人工智能芯片出口限制。为了应诺拜登政府对人工智能芯片的重大限制，一年前英伟达为中国市场设计了芯片A800和H800，它们的运行速度较慢，但仍可被中国公司用于训练人工智能模型。但去年美国商务部的新规也限制了此类芯片的销售，要求所有达到一定总处理性能或性能密度的硬件都必须获得出口许可。

有一种说法是，中低端的GPU芯片造出来，它可以用堆叠GPU芯片和GPU服务器的方式来实现高端芯片的速度。

对此，Jason表示，在大语言模型或者人工智能模型领域中，它通常的特点就是，越通用的智能，越强有力的智能，那么模型就越来越复杂。它的训练过程就要求计算量非常大，训练数据非常大，同时在使用过程中它要求的内存也很大，运算量也很大，这些都要求芯片要有很强大的计算能力。

“比如说原来一个高端的GPU卡有24G内存，那么一个低端的只有12G，而且计算量比较慢，那我这机子就插四个卡，共同实现一个高端的卡的功能，你可以做到这一点，当然整体运作起来就还不是那么有效。中国很多学校也都按这样的方法在走的，因为它资金也不是很够，买芯片也很难，它就用多个中档的卡拼出一个能用的工作环境。”

“所以对AI这个领域，芯片的控制力不是那么强，只是在研究机构、创造模型的那些机构里头，训练的时候难度增加，训练时间增加。但是训练和应用是两回事，训练的时候要很大的计算量，要很高级的芯片，但是在实际应用的时候，很可能那个模型在一般的手机上都可以运行。芯片对于华为的制约力，要比芯片在AI方面对于中国（中共）的制约力要更强一些。”

世界知名人工智能专家李开复近日接受科技媒体The Information采访时表示，芯片库存足够使用18个月。这些芯片基本上是在限制措施出台前购买的。“我们肯定在努力研究如何使用中国芯片，但这并不容易。对它们进行编程不是我们所熟悉的领域。”

Jason告诉记者说，“现有的软件都是基于英伟达芯片做的，很多的技术分享、论文都是基于这个芯片写的，中国在国内开发，做人工智能训练的芯片，得要自己从头实现人家论文的想法，转成当地的这个芯片的程序，然后才能Run（运行），这个过程中有可能犯错，有大的工作量。想法人家的论文已经说了，但是他得自己实现一遍。”

台湾国防安全研究院战略与资源研究所所长苏紫云在接受大纪元采访时表示，人工智能的核心是两条腿，就是软硬件。软件就是用大数据的学习分析，这部分中国的一些企业其实做得不错，中共的体制给了他们人工智能比较方便的发展环境，政府可以调动所有的数据库相互参照使用；硬件就涉及到先进芯片的生产，既然芯片进入个位数的纳米境界，算力跟耗能都会拉开距离。

他说，“的确可以使用低端的GPU，可以把它想像成是中国古代的算盘。CPU（中央处理器）是指挥者，GPU（图像处理器）是算盘，所以GPU越多当然就可以辅助人工智能的运算。它可以用低端的GPU堆叠，继续做相关人工智能的运作跟发展，可是其实变成非常的没有效率。

“我们用个比较具体的比照来看，如果用先进芯片可能是一个小房间的电脑就行了，那如果用低端的GPU那可能要整个大厦都塞满了才行，所以这就等于把中国锁在真空管的时代，其它国家已经进入电晶体（Transistor）时代了，所以中国可以有限度的发展，可是会被其它国家远远甩在后面。如果把这种设备装在机动的军事装备上面，那么体积太庞大的设备就无法运用到机动的战机、飞弹或者是船舰上。所以算力由硬件决定，那硬件的尺寸大小会决定它最后的应用场景。”◇

（未完待续）

责任编辑：孙芸#

相关专题: 大头条集锦 / 李圆明报导