В области ИИ множество конкурентов, наступила эпоха "битвы ста моделей"
В прошлом месяце в мире ИИ разразилась "битва животных". С одной стороны, Llama от Meta, который пользуется популярностью среди разработчиков благодаря своим открытым исходным кодам. С другой стороны, крупная модель под названием Falcon, которая после своего появления в мае этого года обошла Llama и заняла первое место в рейтинге открытых LLM.
Интересно, что разработчиком Falcon является Институт научных инноваций Абу-Даби, столицы Объединенных Арабских Эмиратов. Министр искусственного интеллекта ОАЭ затем был включен в список "100 самых влиятельных людей в области ИИ", составленный журналом Time.
Сегодня в области ИИ началась эпоха активной конкуренции. Государства и компании с определенной финансовой мощью работают над созданием местных версий ChatGPT. Только в районе Персидского залива Саудовская Аравия недавно приобрела более 3000 чипов H100 для обучения LLM для своих университетов.
Эта ситуация вызывает недоумение: как так получается, что обещанные высокие технологии стали "одинаковыми для каждой страны"?
Трансформер изменил правила игры
В 2017 году восемь компьютерных ученых из Google опубликовали алгоритм Transformer в своей статье «Внимание — это все, что вам нужно», став катализатором нынешнего бума в области ИИ. Сегодня все большие модели, включая серию GPT, построены на основе Transformer.
Революция Transformer заключается в двух основных моментах: во-первых, позиционное кодирование заменило рекуррентные сети, что позволило реализовать параллельные вычисления и значительно повысить эффективность обучения; во-вторых, была дополнительно усилена способность понимания контекста.
Это превратило большие модели из теоретического исследования в инженерную задачу. Инженерные элементы, такие как данные, масштаб вычислений и архитектура модели, стали ключевыми в соревнованиях по ИИ. Любая компания с определенными техническими возможностями может разработать большие модели.
Спор об открытом и закрытом программном обеспечении
На данный момент "Битва больших моделей" стала реальностью. По состоянию на июль в Китае насчитывается 130 больших моделей, что превышает 114 моделей в США. Другие страны, такие как Япония, Индия, Южная Корея и т.д., также имеют свои большие модели.
Однако, легко войти, но трудно добиться успеха. В качестве примера можно привести Falcon, который, хотя и занимает более высокое место в рейтинге, не может существенно повлиять на Meta. Для открытых больших моделей активное сообщество разработчиков является ключевым конкурентным преимуществом. Meta имеет давние традиции открытого кода и лучше справляется с управлением сообществом.
Конечно, повышение производительности также является одним из путей. Но на данный момент большинство LLM значительно отстают от GPT-4. В последнем тесте AgentBench GPT-4 с 4.41 баллами значительно опережает второго места Claude с 2.77 баллами, а другие модели с открытым исходным кодом находятся около 1 балла.
Причиной этого разрыва является команда优秀科学家 OpenAI и накопленный за долгие годы опыт. Основой больших моделей является экосистема ( открытый код ) или чисто рассуждательная способность ( закрытый код ).
Дисбаланс между затратами и доходами
В настоящее время в отрасли больших моделей существует серьезный дисбаланс между затратами и доходами. По оценкам Sequoia Capital, мировые технологические компании ежегодно тратят до 200 миллиардов долларов на инфраструктуру больших моделей, в то время как годовой доход от больших моделей составляет максимум 75 миллиардов долларов, что создает дефицит как минимум в 125 миллиардов долларов.
Даже такие гиганты программного обеспечения, как Microsoft и Adobe, сталкиваются с убытками в области AI-продуктов. Большинство компаний с крупными моделями после огромных вложений все еще не нашли четкой модели получения прибыли.
С учетом усиления однородной конкуренции и увеличения открытых моделей, простые поставщики крупных моделей могут столкнуться с большими трудностями. В будущем ценность ИИ, возможно, будет больше проявляться в конкретных областях применения, а не в самой модели.
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
18 Лайков
Награда
18
5
Поделиться
комментарий
0/400
0xSherlock
· 08-06 18:26
Более притягательно, чем деньги
Посмотреть ОригиналОтветить0
WhaleMinion
· 08-06 17:20
Война только начинается
Посмотреть ОригиналОтветить0
SignatureDenied
· 08-06 17:05
Технологии не знают границ
Посмотреть ОригиналОтветить0
LuckyBearDrawer
· 08-06 17:03
Деньги могут решить все
Посмотреть ОригиналОтветить0
SelfStaking
· 08-06 16:59
Торговля криптовалютой не так важно, как создание моделей
AI большие модели цветут пышным цветом, снижение технологических барьеров вызывает глобальную конкуренцию
В области ИИ множество конкурентов, наступила эпоха "битвы ста моделей"
В прошлом месяце в мире ИИ разразилась "битва животных". С одной стороны, Llama от Meta, который пользуется популярностью среди разработчиков благодаря своим открытым исходным кодам. С другой стороны, крупная модель под названием Falcon, которая после своего появления в мае этого года обошла Llama и заняла первое место в рейтинге открытых LLM.
Интересно, что разработчиком Falcon является Институт научных инноваций Абу-Даби, столицы Объединенных Арабских Эмиратов. Министр искусственного интеллекта ОАЭ затем был включен в список "100 самых влиятельных людей в области ИИ", составленный журналом Time.
Сегодня в области ИИ началась эпоха активной конкуренции. Государства и компании с определенной финансовой мощью работают над созданием местных версий ChatGPT. Только в районе Персидского залива Саудовская Аравия недавно приобрела более 3000 чипов H100 для обучения LLM для своих университетов.
Эта ситуация вызывает недоумение: как так получается, что обещанные высокие технологии стали "одинаковыми для каждой страны"?
Трансформер изменил правила игры
В 2017 году восемь компьютерных ученых из Google опубликовали алгоритм Transformer в своей статье «Внимание — это все, что вам нужно», став катализатором нынешнего бума в области ИИ. Сегодня все большие модели, включая серию GPT, построены на основе Transformer.
Революция Transformer заключается в двух основных моментах: во-первых, позиционное кодирование заменило рекуррентные сети, что позволило реализовать параллельные вычисления и значительно повысить эффективность обучения; во-вторых, была дополнительно усилена способность понимания контекста.
Это превратило большие модели из теоретического исследования в инженерную задачу. Инженерные элементы, такие как данные, масштаб вычислений и архитектура модели, стали ключевыми в соревнованиях по ИИ. Любая компания с определенными техническими возможностями может разработать большие модели.
Спор об открытом и закрытом программном обеспечении
На данный момент "Битва больших моделей" стала реальностью. По состоянию на июль в Китае насчитывается 130 больших моделей, что превышает 114 моделей в США. Другие страны, такие как Япония, Индия, Южная Корея и т.д., также имеют свои большие модели.
Однако, легко войти, но трудно добиться успеха. В качестве примера можно привести Falcon, который, хотя и занимает более высокое место в рейтинге, не может существенно повлиять на Meta. Для открытых больших моделей активное сообщество разработчиков является ключевым конкурентным преимуществом. Meta имеет давние традиции открытого кода и лучше справляется с управлением сообществом.
Конечно, повышение производительности также является одним из путей. Но на данный момент большинство LLM значительно отстают от GPT-4. В последнем тесте AgentBench GPT-4 с 4.41 баллами значительно опережает второго места Claude с 2.77 баллами, а другие модели с открытым исходным кодом находятся около 1 балла.
Причиной этого разрыва является команда优秀科学家 OpenAI и накопленный за долгие годы опыт. Основой больших моделей является экосистема ( открытый код ) или чисто рассуждательная способность ( закрытый код ).
Дисбаланс между затратами и доходами
В настоящее время в отрасли больших моделей существует серьезный дисбаланс между затратами и доходами. По оценкам Sequoia Capital, мировые технологические компании ежегодно тратят до 200 миллиардов долларов на инфраструктуру больших моделей, в то время как годовой доход от больших моделей составляет максимум 75 миллиардов долларов, что создает дефицит как минимум в 125 миллиардов долларов.
Даже такие гиганты программного обеспечения, как Microsoft и Adobe, сталкиваются с убытками в области AI-продуктов. Большинство компаний с крупными моделями после огромных вложений все еще не нашли четкой модели получения прибыли.
С учетом усиления однородной конкуренции и увеличения открытых моделей, простые поставщики крупных моделей могут столкнуться с большими трудностями. В будущем ценность ИИ, возможно, будет больше проявляться в конкретных областях применения, а не в самой модели.