本サイトはアフィリエイト広告を利用しています
韓国人「サムスン・SKハイニックス、また暴落するのか?」→「いや、むしろ需要増につながる」グーグルのAIメモリ圧縮技術「ターボクワント」を巡る議論
グーグルのAIメモリ圧縮技術「ターボクワント」が、サムスン電子やSKハイニックスといったメモリ半導体企業に与える影響について、市場の注目が集まっています。世界AI学会(ICLR)でターボクワントの具体的な検証が行われるのを前に、専門家からは「むしろ需要増加につながる」との見方が示されています。
ブラジルで開催されるICLRでは、グーグルがターボクワントに関する論文を正式に発表し、同僚研究者による検証を経て、6月頃には実際のプログラムコードを全世界に公開する予定です。グーグルが先月、ターボクワントの論文を公開して以来、世界のメモリ半導体市場への影響について急速に議論が巻き起こりました。
ターボクワントは、大規模言語モデル(LLM)が文脈を記憶する「KVキャッシュ(一時メモリ)」を圧縮する技術です。従来は圧縮せずに16ビットを使用していたものを画期的に削減し、効率を高める方式です。この技術によりメモリ使用量が6分の1に削減されることから、米国のマイクロンや韓国のサムスン電子、SKハイニックスといったメモリ半導体生産企業にとって悪材料となるのではないかとの懸念が広がり、株価が急落する事態も発生しました。
しかし、学界やAI半導体業界を中心に、このような市場の「ターボクワントショック」は過剰であるとの反論に重きが置かれ始めています。ハイパーアクセルのイ・ジンウォン最高技術責任者(CTO)は、「従来の方式が圧縮なしで16ビットを使用していたのに対し、3~4ビット量子化などを通じて構造的に最適化する技術は、すでに学界で継続的に議論されてきた」とし、「グーグルの量子化方式自体は良いアイデアだが、4ビット量子化が完全に新しいわけではなく、当時の株式市場の反応は過剰だった」と分析しました。
イCTOはさらに、「ターボクワントはAIモデルの効率を高めることで、高価なコスト問題からNVIDIAのGPUなどを使用できなかった企業の需要を増やすだろう」と述べ、「むしろAIサービスの限界を克服する技術として、ICLR学会でターボクワントがメモリ保存空間を確保しただけでなく、速度も目標通りに速くなったことが適切に検証されれば、半導体消費を促進するきっかけになるだろう」と語りました。メモリ使用量が6分の1に減少することは、効率性を高めて複雑で膨大なAIサービスを実現できることを意味し、これは最終的にメモリ半導体生産企業のパイを縮小するのではなく、インフラ拡大を通じた需要増加につながるという説明です。
モビリンツのシン・ドンジュ代表も、「グーグルの影響力に比べて、メディアを通じてバイラル(口コミ)になったことで話題になっただけで、ターボクワントは突然現れた技術ではない」とし、「ターボクワントのような効率化された技術によって、これまで活用されていなかった分野まで市場需要がさらに拡大し、SKハイニックスやサムスン電子などのメモリ企業への需要は増え続けるだろう」と評価しました。シン代表は、最近過去最高の実績を上げているサムスン電子とSKハイニックスの今後の株価は、需要よりも供給サイドによって決定されるとの見方を示しています。彼は、「マイクロン、サムスン電子、ハイニックスの3社間の競争や、生産能力(キャパ)増設を巡る駆け引き、中国メモリ企業の追撃など、むしろ供給サイドの影響が今後の株価を決定する可能性がある」と予測しました。
科学技術企画評価院(KISTEP)技術予測センターのシン・ドンピョンセンター長は、「ターボクワントはハードウェアの問題をソフトウェアで解決しようとする試みの一環だ」とし、「ターボクワントの影響により、長期的にはAIサービスが拡大し、より多くのデバイスでAI演算が可能になることで、オンデバイスAI市場も拡大するだろう」と述べました。
引用元記事:https://n.news.naver.com/article/277/0005751477
