中国大手スマホ、大規模言語モデルを続々導入 「真のAIアシスタント」実現目指すも課題山積

中国手机大厂陆续导入大规模语言,旨在实现“真正的人工智能助手”

中国で大規模言語モデルをめぐる争いがスマホメーカーにまで及んでいる。
中国のスマートフォン大手vivoが11月1日、10億、100億、1000億規模のパラメーター数をカバーする大規模言語モデル(LLM)「藍心(BlueLM)」5種類を発表した。スマートフォン・IoT機器大手のシャオミ(xiaomi、小米集団)も先月、大規模言語モデルを搭載したAIアシスタント「小愛同学(xiao AI)」を自社の新しい「xiaomi HyperOS(小米澎湃OS)」に組み込んだ。ファーウェイも8月に独自OS「HarmonyOS 4」のAIアシスタント「小芸」に大規模言語モデルを導入したことを発表、OPPOやHonor(栄耀)も大規模言語モデルをベースにAIアシスタントを刷新すると表明している。
スマホメーカーは大規模言語モデルにかなりの投資をしている。vivo副総裁の周囲氏によると、同社は6年にわたり大規模言語モデルの開発と改良に取り組み、200億元(約4200億円)を超える資金を投入、1000人以上のスタッフが関わってきたという。

在中国,围绕着大语言模型AI的争斗已经波及到了智能手机制造商。
11月1日,中国智能手机巨头vivo发布了5种可覆盖10亿、100亿、1000亿规模参数的大语言模型AI“蓝心”。上个月,智能手机和物联网设备巨头小米集团也推出了搭载大规模语言模型的人工智能助手“小爱同学和HyperOS(澎湃OS)”。华为8月推出自研操作系统HarmonyOS 4的人工智能助手“小艺”大模型版,OPPO和荣耀也表示将大模型更新进人工智能助手。
智能手机制造商对大规模语言模型进行了相当大的投资。据vivo副总裁周围介绍,该公司6年来致力于大规模语言模型的开发和改良,投入了超过200亿元人民币(约4200亿日元)的资金,1000多名员工参与其中。

スマホに大規模言語モデル搭載、高いハードル
vivoとHonor、シャオミの大規模言語モデルはいずれもパラメーター数60億や70億というところから始め、徐々に規模を大きくしているようだ。
vivoの周副総裁は社内テストの結果を踏まえ、簡単な文書の要約や分析をするにはパラメーター数70億の規模で十分だが、本当の意味で「創発(AIが予想外の能力を開花させること)」を実現するにはまだ改良の余地が大きく、130億のほうが好ましいだろうとした。

智能手机配备大语言模型,难度很高
vivo和Honor、小米的大规模语言模型都是从60亿、70亿参数开始,逐渐扩大规模。
vivo副总裁周表示,根据公司内部测试的结果,70亿参数的规模足以完成简单的文档摘要和分析,但要实现真正意义上的“创造能力”,还有待改进。提升空间还很大,提到一百三十亿比较理想。

例えば、「深圳から北京への航空券を買う」ことを指示したとする。この簡単な指示にも実は、ユーザーの予算はどれくらいか、何時のフライトに乗りたいのか、好みの航空会社はどこか、などといった多くのタスクが含まれている。「複雑なタスク分析にはパラメーター数10億では不十分で、70億なら辛うじて使えるレベル、130億でぴったり」だという。
使用されているコンピューティング技術には2通りあり、Honorとシャオミはエッジコンピューティングを使い、vivoはエッジコンピューティングとクラウドコンピューティングを併用している。

例如,发出一个“买从深圳到北京的机票”的指令。这个简单的指令实际上包含了用户的预算是多少、想乘坐几点的航班、喜欢的航空公司等很多任务。“对于复杂的任务分析来说,10亿参数是不够的,70亿参数勉强可以使用,130亿参数正好”。
使用的计算技术有两种,Honor和小米使用边缘计算,vivo同时使用边缘计算和云计算。

この2つの方式にはそれぞれ長所と短所がある。クラウドコンピューティングの欠点は費用がかかりすぎることだ。業界関係者によると、クラウドコンピューティングを利用した大規模言語モデルの演算処理には1回あたり0.12元(約2.5円)かかる。もし3億人が毎日10回利用したとすれば、スマホメーカーは年間に100億元(約2100億円)以上の余分な出費を負担することになる。
これに対し、エッジコンピューティングはコストを抑えられる。データをクラウドで保管しないので、セキュリティが高く、計算効率もいい。その一方で、スマホ端末自体に高いスペックが求められる。パラメーター10億の大規模言語モデルにはメモリーが1G、70億なら4G必要で、これが130億になると7Gにもなってしまうが、現在のハイエンドスマホでも大半がメモリーは12Gか16Gだ。使い勝手のいい大規模言語モデルをスマホ端末に導入しようとすればメモリーの半分以上を使ってしまい、スマホの動作に影響する可能性がある。

这两种方式各有利弊。云计算的缺点是费用过高。据业内人士介绍,利用云计算的大规模语言模型的每次运算需要0.12元人民币。如果有3亿人每天使用10次,那么智能手机制造商一年就要负担100亿元人民币(约2100亿日元)以上的额外支出。
与此相对,边缘计算可以降低成本。因为数据不存储在云端,所以安全性高,计算效率也高。另一方面,对智能手机本身的配置要求也很高。参数为10亿的大规模语言机型需要1g内存,70亿则需要4g内存,130亿则需要7g内存,即使是现在的高端智能手机,内存也大多是12g或16g。如果在智能手机终端上导入使用方便的大规模语言模型,就会占用一半以上的内存,可能会影响手机的运行。

大規模言語モデルをスマホに搭載するには、メモリーだけにとどまらず、チップにも高い処理能力が必要になる。現在供給可能なチップのうち、台湾Media Tek(聯發科技)の「Dimensity 9300」と米クアルコム(Qualcomm)の「Snapdraon8 Gen3」だけが大規模言語モデルのエッジコンピューティングに対応できるという。
スマホのスペックが限定されるため、大規模言語モデルはしばらくの間はハイエンドスマホのみに許される機能になるだろう。

要想在智能手机上搭载大规模语言模型,不仅需要存储器,芯片也需要很高的处理能力。目前可供应的芯片中,台湾联发科的“天玑9300”和美国高通的“骁龙Gen3”能够支持大规模语言模型的边缘计算。
由于手机的配置受到限制,大规模语言模式在一段时间内将成为高端智能手机才能使用的功能。

原创翻译:龙腾网 https://www.ltaaa.cn 转载请注明出处


スマホの大規模言語モデルと未来のAIアシスタント
ほぼすべてのスマホメーカーが期せずして大規模言語モデルをAIアシスタントにも導入している。かつてはメーカーごとに独自のAIアシスタントを開発し、OPPOなら「小布」、ファーウェイは「小芸」、vivoは「小V」を搭載していたが、ほとんど役に立たなかった。ユーザーの指示を理解できず、できることも限られていたため、ユーザーの業務や生活の中心的ツールになるのは難しかった。

智能手机的大语言模型和未来的人工智能助手
几乎所有的智能手机厂商都不约而同地将大语言模型引入人工智能助手。过去每个厂商都开发了自己的人工智能助手,OPPO有“小布”,华为有“小艺”,vivo有“小V”,但几乎没有什么用。因为不能理解用户的指示,能做的事情也有限,所以很难成为用户业务和生活的核心工具。

しかし大規模言語モデルを使えば、AIアシスタントの理解力は幼稚園レベルから高校生レベルへと徐々に進化する。どのメーカーも明らかに、ユーザー個人をサポートできる新たなAIアシスタントを作り上げたいと考えている。
OPPOのチーフプロダクトオフィサー劉作虎氏は「大規模言語モデルの知識は個人の知識を超え、あたかも人のようにユーザーの言葉を理解し、毎日観察して学習し、習慣を把握して、最適なアシストでタスクを完遂する」と語る。

但如果使用大规模语言模型,人工智能助手的理解力将从幼儿园水平逐渐进化到高中生水平。很明显,所有厂商都想打造能够帮助用户的全新人工智能助手。
OPPO首席产品官刘作虎表示:“大规模语言模型的知识超越了个人知识,它能像人一样理解用户的语言,每天观察和学习,掌握用户的习惯,以最佳的辅助完成任务。”

各メーカーが公開している情報によると、各社の大規模言語モデルはいずれも言語理解やテキスト生成、自然対話、ロールプレイングなどの機能にフォーカスしており、ユーザーが特定の画像検索や文章の作成、文章の要点整理をするのに利用できるようだ。
しかし大規模言語モデルを活用したAIアシスタントが本当に役に立つ存在となるにはさらに難しい課題がある。それは上位レイヤーのアプリと連携させ、そのデータと機能を使えるようにすることだ。

从各家厂商公开的信息来看,各家公司的大规模语言模型都聚焦于语言理解、文本生成、自然对话、角色扮演等功能,帮助用户搜索特定的图像、生成文章、以及整理文章要点。
但是,使用大规模语言模型的人工智能助手要想成为真正有用的存在,还有更难的课题。那就是与上层的应用程序连接,使用其数据和功能。

AIアシスタントに航空券を購入させるという指示をもう一度例にしてみよう。タスクを完遂するには、決済サービスのアリペイ(支付宝)やWeChat Pay(微信支付)などの決済情報や、ユーザーのスケジュール、過去の航空機利用などの情報にアクセスする権限が必要になる。ある関係者によると、過去の閲覧に伴うトラフィックやデータはアプリ側が所有し、アプリ側はこれを差し出したくはないのだという。
このため、今後大規模言語モデルをスマホ端末に搭載できるか否かは、スマホメーカーがスマホという限られた空間内で大規模言語モデルの能力をいかに最大限に発揮させられるか、そして大規模言語モデルとアプリをいかに緊密に連携させられるかということにかかっている。

以让人工智能助手购买机票的指令举例子。为了完成任务,需要用到支付宝和微信等支付服务的支付信息、用户的日程安排、过去乘坐的飞机信息等权限。据相关人士透露,过去的浏览所带来的流量和数据归应用程序方所有,应用程序方并不想交出这些数据。
因此,今后大规模语言模型能否安装在智能手机终端上,取决于智能手机制造商如何在智能手机这一有限的空间内最大限度地发挥大规模语言模型的能力,以及如何让大规模语言模型和应用程序进行紧密的联动。