مشاريع Web3 المفاهيمية للذكاء الاصطناعي أصبحت هدفًا لجذب الأموال في الأسواق الأولية والثانوية.
تظهر الفرص في Web3 في صناعة الذكاء الاصطناعي من خلال: استخدام الحوافز الموزعة لتنسيق العرض المحتمل في ذيل طويل - عبر البيانات والتخزين والحوسبة؛ في الوقت نفسه، إنشاء نماذج مفتوحة المصدر بالإضافة إلى سوق لامركزي لوكلاء الذكاء الاصطناعي.
تستخدم الذكاء الاصطناعي في صناعة Web3 بشكل رئيسي في التمويل على السلسلة (المدفوعات المشفرة، التداول، تحليل البيانات) بالإضافة إلى المساعدة في التطوير.
تظهر فائدة AI+Web3 في التكامل بين الاثنين: من المتوقع أن يتصدى Web3 لتركيز AI، ومن المتوقع أن تساعد AI Web3 في تجاوز الحدود.
على مدى العامين الماضيين، كان تطور الذكاء الاصطناعي وكأنه قد تم الضغط على زر التسريع، هذه الظاهرة التي أثارتها Chatgpt لم تفتح فقط عالماً جديداً للذكاء الاصطناعي التوليدي، بل أثارت أيضاً موجة في عالم Web3.
بمساعدة مفهوم الذكاء الاصطناعي، يبدو أن تمويل سوق العملات المشفرة المتباطئ قد شهد انتعاشًا ملحوظًا. وفقًا للإحصاءات الإعلامية، تمكّن 64 مشروعًا من Web3 + AI من إكمال التمويل فقط في النصف الأول من عام 2024، حيث حقق نظام التشغيل المعتمد على الذكاء الاصطناعي Zyber365 أعلى مبلغ للتمويل وقدره 100 مليون دولار في الجولة A.
السوق الثانوية أكثر ازدهارًا، حيث تظهر بيانات مواقع تجميع التشفير أن القيمة السوقية الإجمالية لقطاع الذكاء الاصطناعي وصلت إلى 48.5 مليار دولار خلال فترة قصيرة لا تتجاوز العام، وحجم التداول خلال 24 ساعة يقارب 8.6 مليار دولار؛ الفوائد الناتجة عن تقدم تقنيات الذكاء الاصطناعي واضحة، فبعد إطلاق نموذج سورا من OpenAI لتحويل النص إلى فيديو، ارتفع متوسط سعر قطاع الذكاء الاصطناعي بنسبة 151٪؛ كما أن تأثير الذكاء الاصطناعي امتد أيضًا إلى واحدة من القطاعات الجاذبة للعملات المشفرة، الميم: حيث حقق أول مفهوم لوكيل الذكاء الاصطناعي، ميمكوين - GOAT، شهرة سريعة وحصل على تقييم بلغ 1.4 مليار دولار، مما أثار موجة من حماس ميم الذكاء الاصطناعي.
أصبحت الأبحاث والمواضيع المتعلقة بـ AI+Web3 شديدة الحماس، من AI+Depin إلى AI Memecoin وصولاً إلى AI Agent و AI DAO الحالية، حيث إن مشاعر FOMO لم تعد قادرة على مواكبة سرعة تدوير السرد الجديد.
AI+Web3، هذا التركيب المليء بالمال الساخن، والنوافذ الجديدة، وأحلام المستقبل، لا مفر من أن يُنظر إليه كزواج مُرتب يتم برعاية رأس المال، ويبدو أننا نجد صعوبة في التمييز بين ما إذا كانت هذه الساحة هي ساحة المضاربين، أم أنها ليلة الانفجار في الفجر؟
للإجابة على هذا السؤال، فإن تأملًا أساسيًا لكلا الطرفين هو: هل سيكون الوضع أفضل مع الطرف الآخر؟ هل يمكن الاستفادة من نموذج الطرف الآخر؟ في هذه المقالة، نحاول أيضًا أن نقف على أكتاف السابقين لننظر في هذه الصورة: كيف يمكن أن تلعب Web3 دورًا في مختلف جوانب تكنولوجيا AI، وما الجديد الذي يمكن أن تقدمه AI لـ Web3؟
الجزء 1 ما هي الفرص الموجودة في Web3 تحت كومة الذكاء الاصطناعي؟
قبل مناقشة هذا الموضوع، نحتاج إلى فهم تقنية نموذج AI الكبير:
استخدم لغة أكثر بساطة لوصف العملية بأكملها: "النموذج الكبير" يشبه دماغ الإنسان، في المراحل المبكرة، ينتمي هذا الدماغ إلى طفل حديث الولادة، يحتاج إلى مراقبة واستيعاب المعلومات الهائلة من العالم من حوله لفهم هذا العالم، وهذه هي مرحلة "جمع البيانات"؛ نظرًا لأن الكمبيوتر لا يمتلك حواس الإنسان مثل البصر والسمع، قبل التدريب، يجب تحويل المعلومات الضخمة غير المعلنة من الخارج من خلال "المعالجة المسبقة" إلى تنسيق معلومات يمكن للكمبيوتر فهمه واستخدامه.
بعد إدخال البيانات، يقوم الذكاء الاصطناعي من خلال "التدريب" ببناء نموذج يمتلك القدرة على الفهم والتنبؤ، ويمكن اعتباره بمثابة عملية فهم وتعلم الطفل للعالم الخارجي تدريجياً، حيث تمثل معلمات النموذج القدرة اللغوية للطفل التي تتغير باستمرار خلال عملية التعلم. عندما يبدأ المحتوى التعليمي في التخصص، أو يتم الحصول على ردود فعل من خلال التواصل مع الآخرين وتصحيحه، يدخل النموذج الكبير في مرحلة "التخصيص".
عندما يبدأ الأطفال في النمو والتحدث، يصبحون قادرين على فهم المعاني والتعبير عن مشاعرهم وأفكارهم في محادثات جديدة، وهذه المرحلة تشبه "الاستدلال" في نماذج الذكاء الاصطناعي الكبيرة، حيث يمكن للنموذج التنبؤ وتحليل المدخلات اللغوية والنصية الجديدة. يعبر الأطفال عن مشاعرهم وقدرتهم اللغوية، ويصفون الأشياء ويحلون مشكلات متنوعة، وهذا يشبه أيضًا كيفية تطبيق نماذج الذكاء الاصطناعي الكبيرة في مرحلة الاستدلال بعد انتهاء التدريب واستخدامها في مهام محددة مثل تصنيف الصور والتعرف على الصوت.
ووكيل الذكاء الاصطناعي يقترب أكثر من الشكل التالي للنموذج الكبير - القدرة على تنفيذ المهام بشكل مستقل والسعي وراء الأهداف المعقدة، ليس فقط لديه القدرة على التفكير، ولكن أيضًا قادر على التذكر والتخطيط، وقادر على استخدام الأدوات للتفاعل مع العالم.
في الوقت الحالي، وبالنظر إلى نقاط الألم المتعلقة بالذكاء الاصطناعي في مختلف الأنظمة، فقد شكلت Web3 حاليًا نظامًا بيئيًا متعدد المستويات ومتصلًا، يشمل جميع مراحل عملية نماذج الذكاء الاصطناعي.
واحد، الطبقة الأساسية: قوة الحوسبة والبيانات مثل Airbnb
▎قوة الحوسبة
حالياً، واحدة من أعلى تكاليف الذكاء الاصطناعي هي القدرة الحاسوبية والطاقة اللازمة لتدريب النماذج واستنتاج النماذج.
مثال على ذلك هو أن LLAMA3 من ميتا يحتاج إلى 16000 وحدة معالجة رسومات H100 من إنتاج NVIDIA (وهي وحدة معالجة رسومات متطورة مصممة خصيصًا لأعباء العمل في الذكاء الاصطناعي والحوسبة عالية الأداء). يستغرق إكمال التدريب 30 يومًا. سعر النسخة ذات 80 جيجابايت يتراوح بين 30000 و 40000 دولار، مما يتطلب استثمارًا في أجهزة الحوسبة (GPU + شرائح الشبكة) يتراوح بين 400 إلى 700 مليون دولار، بينما يحتاج التدريب الشهري إلى استهلاك 1.6 مليار كيلووات ساعة، مما يجعل نفقات الطاقة الشهرية تقارب 20 مليون دولار.
بالنسبة لفك ضغط قوة الذكاء الاصطناعي، فإنها تمثل أيضًا أحد المجالات الأولى التي تتقاطع فيها Web3 مع الذكاء الاصطناعي - DePin (شبكة البنية التحتية الفيزيائية اللامركزية). حتى الآن، عرض موقع DePin Ninja بيانات ما يزيد عن 1400 مشروع، حيث تشمل مشاريع مشاركة قوة GPU الرائدة io.net وAethir وAkash وRender Network وغيرها.
المنطق الرئيسي وراء ذلك هو: يسمح النظام للأفراد أو الكيانات التي تمتلك موارد GPU غير مستخدمة بتقديم قدراتهم الحاسوبية بطريقة لامركزية دون الحاجة إلى إذن، من خلال سوق على الإنترنت للمشترين والبائعين مشابهة لـ Uber أو Airbnb، مما يزيد من استخدام موارد GPU غير المستخدمة بشكل كافٍ، وبالتالي يحصل المستخدم النهائي على موارد حسابية فعالة بتكلفة أقل؛ وفي الوقت نفسه، تضمن آلية الرهن أنه في حالة حدوث انتهاكات لآلية مراقبة الجودة أو انقطاع الشبكة، يتعرض مقدمو الموارد للعقوبات المناسبة.
تتميز ب:
تجميع موارد GPU غير المستخدمة: يتمثل المورد الرئيسي في مشغلي مراكز البيانات الصغيرة والمتوسطة المستقلة التابعة لجهات خارجية، مثل عمليات تعدين العملات الرقمية، حيث تتميز موارد القوة الحاسوبية الزائدة التي تملكها، وآلية التوافق هي PoS لأجهزة تعدين مثل FileCoin و ETH. هناك أيضًا مشاريع تكرس جهودها لإطلاق أجهزة ذات عوائق دخول أقل، مثل exolab التي تستخدم MacBook و iPhone و iPad وغيرها من الأجهزة المحلية لإنشاء شبكة قوة حاسوبية لتشغيل استنتاجات النماذج الكبيرة.
مواجهة سوق الذكاء الاصطناعي الطويلة الأمد:
أ. "من الناحية التقنية" يعتبر سوق الطاقة الحوسبية اللامركزية أكثر ملاءمة لخطوات الاستدلال. يعتمد التدريب بشكل أكبر على قدرة معالجة البيانات التي توفرها مجموعات GPU العملاقة، بينما تتطلب عملية الاستدلال أداءً أقل نسبيًا من GPU، مثل Aethir التي تركز على أعمال العرض منخفضة الكمون وتطبيقات استدلال الذكاء الاصطناعي.
ب. "من جهة الطلب"، لن تقوم الأطراف ذات القدرة الحاسوبية المتوسطة بتدريب نماذج كبيرة خاصة بها بشكل منفرد، بل ستختار فقط تحسين وتعديل بعض النماذج الكبيرة الرائدة، وهذه السيناريوهات مناسبة بشكل طبيعي لموارد الحوسبة المتاحة الموزعة.
الملكية اللامركزية: المعنى التكنولوجي للبلوكشين هو أن مالكي الموارد يحتفظون دائمًا بحقهم في التحكم في الموارد، مع إمكانية التكيف وفقًا للاحتياجات، وفي نفس الوقت يحققون الأرباح.
▎البيانات
البيانات هي أساس الذكاء الاصطناعي. إذا لم تكن هناك بيانات، فإن الحساب سيكون عديم الفائدة تمامًا مثل الطوفان بلا جذور، والعلاقة بين البيانات والنموذج تشبه المقولة الشهيرة "القمامة في، القمامة خارج". كمية البيانات وجودة المدخلات تحدد جودة مخرجات النموذج النهائي. بالنسبة لتدريب نماذج الذكاء الاصطناعي الحالية، تحدد البيانات قدرة النموذج اللغوية، وقدرته على الفهم، وحتى القيم الإنسانية والتعبيرات الإنسانية. حاليًا، تركز معضلة طلب البيانات في الذكاء الاصطناعي على أربعة مجالات رئيسية:
جوع البيانات: تعتمد نماذج الذكاء الاصطناعي على كميات كبيرة من بيانات المدخلات للتدريب. تظهر المعلومات العامة أن OpenAI قامت بتدريب GPT-4 باستخدام عدد هائل من المعاملات يصل إلى تريليونات.
جودة البيانات: مع دمج الذكاء الاصطناعي مع مختلف الصناعات، فإن توقيت البيانات، وتنوع البيانات، واحترافية البيانات المتخصصة، واستيعاب مصادر البيانات الناشئة مثل المشاعر على وسائل التواصل الاجتماعي، قد وضعت متطلبات جديدة لجودتها.
مسائل الخصوصية والامتثال: بدأت الدول والشركات المختلفة في إدراك أهمية مجموعات البيانات عالية الجودة، وتفرض قيودًا على جمع البيانات.
تكاليف معالجة البيانات باهظة: حجم البيانات كبير، وعملية المعالجة معقدة. تظهر المعلومات العامة أن أكثر من 30% من تكاليف البحث والتطوير لشركات الذكاء الاصطناعي تُستخدم في جمع ومعالجة البيانات الأساسية.
حاليًا، تظهر حلول web3 في الجوانب الأربعة التالية:
جمع البيانات: البيانات الحقيقية التي يمكن توفيرها مجانًا عن طريق السحب تنفد بسرعة، حيث ترتفع نفقات الشركات العاملة في مجال الذكاء الاصطناعي المدفوعة مقابل البيانات عامًا بعد عام. ولكن في الوقت نفسه، لم تعود هذه النفقات بالنفع على المساهمين الحقيقيين في البيانات، حيث استمتعت المنصات بالكامل بقيمة الإبداع الناتجة عن البيانات، مثل Reddit التي حققت إيرادات إجمالية قدرها 203 مليون دولار من خلال الاتفاقيات على ترخيص البيانات مع شركات الذكاء الاصطناعي.
تتمثل رؤية Web3 في السماح للمستخدمين الذين يساهمون حقًا بالمشاركة في إنشاء القيمة الناتجة عن البيانات، وكذلك الحصول على بيانات أكثر خصوصية وقيمة من المستخدمين بطريقة منخفضة التكلفة من خلال شبكة موزعة وآلية تحفيز.
مثل Grass هو طبقة بيانات وشبكة لامركزية، يمكن للمستخدمين من خلالها تشغيل عقد Grass، والمساهمة في عرض النطاق الترددي الفائض وبيانات الترحيل لالتقاط البيانات الحية من جميع أنحاء الإنترنت، والحصول على مكافآت رمزية؛
Vana قدمت مفهوم فريد من نوعه لبركة السيولة البيانات (DLP)، حيث يمكن للمستخدمين رفع بياناتهم الخاصة (مثل سجلات الشراء، عادات التصفح، أنشطة وسائل التواصل الاجتماعي، إلخ) إلى DLP معينة، واختيار ما إذا كانوا سيرخصون هذه البيانات لاستخدام طرف ثالث معين؛
في PublicAI، يمكن للمستخدمين استخدام #AI 或#Web3 كعلامة تصنيف على X و@PublicAI لجمع البيانات.
معالجة البيانات: في عملية معالجة بيانات الذكاء الاصطناعي، نظرًا لأن البيانات التي تم جمعها غالبًا ما تكون مشوشة وتحتوي على أخطاء، يجب تنظيفها وتحويلها إلى تنسيق قابل للاستخدام قبل تدريب النموذج، ويتضمن ذلك مهام متكررة مثل التوحيد والترشيح ومعالجة القيم المفقودة. هذه المرحلة هي واحدة من القليل من الأجزاء اليدوية في صناعة الذكاء الاصطناعي، وقد نشأت منها صناعة مُعَلِّمِي البيانات، ومع زيادة متطلبات جودة البيانات للنماذج، ارتفعت عتبة دخول مُعَلِّمِي البيانات، وهذه المهمة تناسب بشكل طبيعي آلية الحوافز اللامركزية في Web3.
حالياً، تفكر Grass و OpenLayer في إضافة هذه المرحلة الأساسية من التسمية البيانية.
قدمت Synesis مفهوم "Train2earn"، مع التركيز على جودة البيانات، حيث يمكن للمستخدمين الحصول على مكافآت من خلال تقديم بيانات مؤشرة أو تعليقات أو أشكال أخرى من المدخلات.
مشروع تصنيف البيانات Sapien يقوم بتحويل مهام التوسيم إلى لعبة، ويتيح للمستخدمين رهن النقاط لكسب المزيد من النقاط.
3، خصوصية البيانات والأمان: من المهم توضيح أن خصوصية البيانات والأمان هما مفهومين مختلفين. تتعلق خصوصية البيانات بمعالجة البيانات الحساسة، بينما يحمي الأمان المعلومات من الوصول غير المصرح به، والتخريب، والسرقة. ومن ثم، فإن مزايا تقنيات الخصوصية في Web3 وسيناريوهات التطبيق المحتملة تظهر في جانبين: (1) تدريب البيانات الحساسة؛ (2) التعاون في البيانات: يمكن لعدة مالكين للبيانات المشاركة معًا في تدريب الذكاء الاصطناعي دون الحاجة إلى مشاركة بياناتهم الأصلية.
تشمل تقنيات الخصوصية الشائعة في Web3 الحالية ما يلي:
بيئة تنفيذ موثوقة ( TEE )، مثل بروتوكول سوبر؛
التشفير المتجانس بالكامل (FHE)، مثل BasedAI، Fhenix.io أو Inco Network؛
تقنية المعرفة الصفرية (zk)، مثل بروتوكول Reclaim الذي يستخدم تقنية zkTLS، تنتج إثباتات معرفة صفرية لحركة مرور HTTPS، مما يسمح للمستخدمين باستيراد الأنشطة والسمعة وبيانات الهوية من مواقع خارجية بشكل آمن دون الكشف عن المعلومات الحساسة.
ومع ذلك، لا يزال هذا المجال في مراحله المبكرة، حيث لا يزال معظم المشاريع قيد الاستكشاف، وتتمثل إحدى المعضلات الحالية في ارتفاع تكاليف الحساب، ومن الأمثلة على ذلك:
إطار zkML E
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
تسجيلات الإعجاب 19
أعجبني
19
5
مشاركة
تعليق
0/400
Ser_Liquidated
· منذ 8 س
炒作啥呢 都是讲故事المراجحة
شاهد النسخة الأصليةرد0
NotFinancialAdviser
· منذ 8 س
من سيهتم بمصير الويب 3 بعد أن جنى الذكاء الاصطناعي الأموال؟
شاهد النسخة الأصليةرد0
RetiredMiner
· منذ 8 س
فقط ربحت بعض عملة scamcoin
شاهد النسخة الأصليةرد0
SmartContractPhobia
· منذ 8 س
اللامركزية忽悠对吧
شاهد النسخة الأصليةرد0
AirdropChaser
· منذ 8 س
خداع الناس لتحقيق الربح لا يزال نفس عالم العملات الرقمية
تقاطع الذكاء الاصطناعي وWeb3: فرص جديدة وتمكين متبادل
الذكاء الاصطناعي + الويب 3: الأبراج والساحات
ملخص
مشاريع Web3 المفاهيمية للذكاء الاصطناعي أصبحت هدفًا لجذب الأموال في الأسواق الأولية والثانوية.
تظهر الفرص في Web3 في صناعة الذكاء الاصطناعي من خلال: استخدام الحوافز الموزعة لتنسيق العرض المحتمل في ذيل طويل - عبر البيانات والتخزين والحوسبة؛ في الوقت نفسه، إنشاء نماذج مفتوحة المصدر بالإضافة إلى سوق لامركزي لوكلاء الذكاء الاصطناعي.
تستخدم الذكاء الاصطناعي في صناعة Web3 بشكل رئيسي في التمويل على السلسلة (المدفوعات المشفرة، التداول، تحليل البيانات) بالإضافة إلى المساعدة في التطوير.
تظهر فائدة AI+Web3 في التكامل بين الاثنين: من المتوقع أن يتصدى Web3 لتركيز AI، ومن المتوقع أن تساعد AI Web3 في تجاوز الحدود.
! الذكاء الاصطناعي+Web3: الأبراج والساحات
مقدمة
على مدى العامين الماضيين، كان تطور الذكاء الاصطناعي وكأنه قد تم الضغط على زر التسريع، هذه الظاهرة التي أثارتها Chatgpt لم تفتح فقط عالماً جديداً للذكاء الاصطناعي التوليدي، بل أثارت أيضاً موجة في عالم Web3.
بمساعدة مفهوم الذكاء الاصطناعي، يبدو أن تمويل سوق العملات المشفرة المتباطئ قد شهد انتعاشًا ملحوظًا. وفقًا للإحصاءات الإعلامية، تمكّن 64 مشروعًا من Web3 + AI من إكمال التمويل فقط في النصف الأول من عام 2024، حيث حقق نظام التشغيل المعتمد على الذكاء الاصطناعي Zyber365 أعلى مبلغ للتمويل وقدره 100 مليون دولار في الجولة A.
السوق الثانوية أكثر ازدهارًا، حيث تظهر بيانات مواقع تجميع التشفير أن القيمة السوقية الإجمالية لقطاع الذكاء الاصطناعي وصلت إلى 48.5 مليار دولار خلال فترة قصيرة لا تتجاوز العام، وحجم التداول خلال 24 ساعة يقارب 8.6 مليار دولار؛ الفوائد الناتجة عن تقدم تقنيات الذكاء الاصطناعي واضحة، فبعد إطلاق نموذج سورا من OpenAI لتحويل النص إلى فيديو، ارتفع متوسط سعر قطاع الذكاء الاصطناعي بنسبة 151٪؛ كما أن تأثير الذكاء الاصطناعي امتد أيضًا إلى واحدة من القطاعات الجاذبة للعملات المشفرة، الميم: حيث حقق أول مفهوم لوكيل الذكاء الاصطناعي، ميمكوين - GOAT، شهرة سريعة وحصل على تقييم بلغ 1.4 مليار دولار، مما أثار موجة من حماس ميم الذكاء الاصطناعي.
أصبحت الأبحاث والمواضيع المتعلقة بـ AI+Web3 شديدة الحماس، من AI+Depin إلى AI Memecoin وصولاً إلى AI Agent و AI DAO الحالية، حيث إن مشاعر FOMO لم تعد قادرة على مواكبة سرعة تدوير السرد الجديد.
AI+Web3، هذا التركيب المليء بالمال الساخن، والنوافذ الجديدة، وأحلام المستقبل، لا مفر من أن يُنظر إليه كزواج مُرتب يتم برعاية رأس المال، ويبدو أننا نجد صعوبة في التمييز بين ما إذا كانت هذه الساحة هي ساحة المضاربين، أم أنها ليلة الانفجار في الفجر؟
للإجابة على هذا السؤال، فإن تأملًا أساسيًا لكلا الطرفين هو: هل سيكون الوضع أفضل مع الطرف الآخر؟ هل يمكن الاستفادة من نموذج الطرف الآخر؟ في هذه المقالة، نحاول أيضًا أن نقف على أكتاف السابقين لننظر في هذه الصورة: كيف يمكن أن تلعب Web3 دورًا في مختلف جوانب تكنولوجيا AI، وما الجديد الذي يمكن أن تقدمه AI لـ Web3؟
الجزء 1 ما هي الفرص الموجودة في Web3 تحت كومة الذكاء الاصطناعي؟
قبل مناقشة هذا الموضوع، نحتاج إلى فهم تقنية نموذج AI الكبير:
استخدم لغة أكثر بساطة لوصف العملية بأكملها: "النموذج الكبير" يشبه دماغ الإنسان، في المراحل المبكرة، ينتمي هذا الدماغ إلى طفل حديث الولادة، يحتاج إلى مراقبة واستيعاب المعلومات الهائلة من العالم من حوله لفهم هذا العالم، وهذه هي مرحلة "جمع البيانات"؛ نظرًا لأن الكمبيوتر لا يمتلك حواس الإنسان مثل البصر والسمع، قبل التدريب، يجب تحويل المعلومات الضخمة غير المعلنة من الخارج من خلال "المعالجة المسبقة" إلى تنسيق معلومات يمكن للكمبيوتر فهمه واستخدامه.
بعد إدخال البيانات، يقوم الذكاء الاصطناعي من خلال "التدريب" ببناء نموذج يمتلك القدرة على الفهم والتنبؤ، ويمكن اعتباره بمثابة عملية فهم وتعلم الطفل للعالم الخارجي تدريجياً، حيث تمثل معلمات النموذج القدرة اللغوية للطفل التي تتغير باستمرار خلال عملية التعلم. عندما يبدأ المحتوى التعليمي في التخصص، أو يتم الحصول على ردود فعل من خلال التواصل مع الآخرين وتصحيحه، يدخل النموذج الكبير في مرحلة "التخصيص".
عندما يبدأ الأطفال في النمو والتحدث، يصبحون قادرين على فهم المعاني والتعبير عن مشاعرهم وأفكارهم في محادثات جديدة، وهذه المرحلة تشبه "الاستدلال" في نماذج الذكاء الاصطناعي الكبيرة، حيث يمكن للنموذج التنبؤ وتحليل المدخلات اللغوية والنصية الجديدة. يعبر الأطفال عن مشاعرهم وقدرتهم اللغوية، ويصفون الأشياء ويحلون مشكلات متنوعة، وهذا يشبه أيضًا كيفية تطبيق نماذج الذكاء الاصطناعي الكبيرة في مرحلة الاستدلال بعد انتهاء التدريب واستخدامها في مهام محددة مثل تصنيف الصور والتعرف على الصوت.
ووكيل الذكاء الاصطناعي يقترب أكثر من الشكل التالي للنموذج الكبير - القدرة على تنفيذ المهام بشكل مستقل والسعي وراء الأهداف المعقدة، ليس فقط لديه القدرة على التفكير، ولكن أيضًا قادر على التذكر والتخطيط، وقادر على استخدام الأدوات للتفاعل مع العالم.
في الوقت الحالي، وبالنظر إلى نقاط الألم المتعلقة بالذكاء الاصطناعي في مختلف الأنظمة، فقد شكلت Web3 حاليًا نظامًا بيئيًا متعدد المستويات ومتصلًا، يشمل جميع مراحل عملية نماذج الذكاء الاصطناعي.
! الذكاء الاصطناعي+Web3: الأبراج والمربعات
واحد، الطبقة الأساسية: قوة الحوسبة والبيانات مثل Airbnb
▎قوة الحوسبة
حالياً، واحدة من أعلى تكاليف الذكاء الاصطناعي هي القدرة الحاسوبية والطاقة اللازمة لتدريب النماذج واستنتاج النماذج.
مثال على ذلك هو أن LLAMA3 من ميتا يحتاج إلى 16000 وحدة معالجة رسومات H100 من إنتاج NVIDIA (وهي وحدة معالجة رسومات متطورة مصممة خصيصًا لأعباء العمل في الذكاء الاصطناعي والحوسبة عالية الأداء). يستغرق إكمال التدريب 30 يومًا. سعر النسخة ذات 80 جيجابايت يتراوح بين 30000 و 40000 دولار، مما يتطلب استثمارًا في أجهزة الحوسبة (GPU + شرائح الشبكة) يتراوح بين 400 إلى 700 مليون دولار، بينما يحتاج التدريب الشهري إلى استهلاك 1.6 مليار كيلووات ساعة، مما يجعل نفقات الطاقة الشهرية تقارب 20 مليون دولار.
بالنسبة لفك ضغط قوة الذكاء الاصطناعي، فإنها تمثل أيضًا أحد المجالات الأولى التي تتقاطع فيها Web3 مع الذكاء الاصطناعي - DePin (شبكة البنية التحتية الفيزيائية اللامركزية). حتى الآن، عرض موقع DePin Ninja بيانات ما يزيد عن 1400 مشروع، حيث تشمل مشاريع مشاركة قوة GPU الرائدة io.net وAethir وAkash وRender Network وغيرها.
المنطق الرئيسي وراء ذلك هو: يسمح النظام للأفراد أو الكيانات التي تمتلك موارد GPU غير مستخدمة بتقديم قدراتهم الحاسوبية بطريقة لامركزية دون الحاجة إلى إذن، من خلال سوق على الإنترنت للمشترين والبائعين مشابهة لـ Uber أو Airbnb، مما يزيد من استخدام موارد GPU غير المستخدمة بشكل كافٍ، وبالتالي يحصل المستخدم النهائي على موارد حسابية فعالة بتكلفة أقل؛ وفي الوقت نفسه، تضمن آلية الرهن أنه في حالة حدوث انتهاكات لآلية مراقبة الجودة أو انقطاع الشبكة، يتعرض مقدمو الموارد للعقوبات المناسبة.
تتميز ب:
تجميع موارد GPU غير المستخدمة: يتمثل المورد الرئيسي في مشغلي مراكز البيانات الصغيرة والمتوسطة المستقلة التابعة لجهات خارجية، مثل عمليات تعدين العملات الرقمية، حيث تتميز موارد القوة الحاسوبية الزائدة التي تملكها، وآلية التوافق هي PoS لأجهزة تعدين مثل FileCoin و ETH. هناك أيضًا مشاريع تكرس جهودها لإطلاق أجهزة ذات عوائق دخول أقل، مثل exolab التي تستخدم MacBook و iPhone و iPad وغيرها من الأجهزة المحلية لإنشاء شبكة قوة حاسوبية لتشغيل استنتاجات النماذج الكبيرة.
مواجهة سوق الذكاء الاصطناعي الطويلة الأمد:
أ. "من الناحية التقنية" يعتبر سوق الطاقة الحوسبية اللامركزية أكثر ملاءمة لخطوات الاستدلال. يعتمد التدريب بشكل أكبر على قدرة معالجة البيانات التي توفرها مجموعات GPU العملاقة، بينما تتطلب عملية الاستدلال أداءً أقل نسبيًا من GPU، مثل Aethir التي تركز على أعمال العرض منخفضة الكمون وتطبيقات استدلال الذكاء الاصطناعي.
ب. "من جهة الطلب"، لن تقوم الأطراف ذات القدرة الحاسوبية المتوسطة بتدريب نماذج كبيرة خاصة بها بشكل منفرد، بل ستختار فقط تحسين وتعديل بعض النماذج الكبيرة الرائدة، وهذه السيناريوهات مناسبة بشكل طبيعي لموارد الحوسبة المتاحة الموزعة.
▎البيانات
البيانات هي أساس الذكاء الاصطناعي. إذا لم تكن هناك بيانات، فإن الحساب سيكون عديم الفائدة تمامًا مثل الطوفان بلا جذور، والعلاقة بين البيانات والنموذج تشبه المقولة الشهيرة "القمامة في، القمامة خارج". كمية البيانات وجودة المدخلات تحدد جودة مخرجات النموذج النهائي. بالنسبة لتدريب نماذج الذكاء الاصطناعي الحالية، تحدد البيانات قدرة النموذج اللغوية، وقدرته على الفهم، وحتى القيم الإنسانية والتعبيرات الإنسانية. حاليًا، تركز معضلة طلب البيانات في الذكاء الاصطناعي على أربعة مجالات رئيسية:
جوع البيانات: تعتمد نماذج الذكاء الاصطناعي على كميات كبيرة من بيانات المدخلات للتدريب. تظهر المعلومات العامة أن OpenAI قامت بتدريب GPT-4 باستخدام عدد هائل من المعاملات يصل إلى تريليونات.
جودة البيانات: مع دمج الذكاء الاصطناعي مع مختلف الصناعات، فإن توقيت البيانات، وتنوع البيانات، واحترافية البيانات المتخصصة، واستيعاب مصادر البيانات الناشئة مثل المشاعر على وسائل التواصل الاجتماعي، قد وضعت متطلبات جديدة لجودتها.
مسائل الخصوصية والامتثال: بدأت الدول والشركات المختلفة في إدراك أهمية مجموعات البيانات عالية الجودة، وتفرض قيودًا على جمع البيانات.
تكاليف معالجة البيانات باهظة: حجم البيانات كبير، وعملية المعالجة معقدة. تظهر المعلومات العامة أن أكثر من 30% من تكاليف البحث والتطوير لشركات الذكاء الاصطناعي تُستخدم في جمع ومعالجة البيانات الأساسية.
حاليًا، تظهر حلول web3 في الجوانب الأربعة التالية:
تتمثل رؤية Web3 في السماح للمستخدمين الذين يساهمون حقًا بالمشاركة في إنشاء القيمة الناتجة عن البيانات، وكذلك الحصول على بيانات أكثر خصوصية وقيمة من المستخدمين بطريقة منخفضة التكلفة من خلال شبكة موزعة وآلية تحفيز.
مثل Grass هو طبقة بيانات وشبكة لامركزية، يمكن للمستخدمين من خلالها تشغيل عقد Grass، والمساهمة في عرض النطاق الترددي الفائض وبيانات الترحيل لالتقاط البيانات الحية من جميع أنحاء الإنترنت، والحصول على مكافآت رمزية؛
Vana قدمت مفهوم فريد من نوعه لبركة السيولة البيانات (DLP)، حيث يمكن للمستخدمين رفع بياناتهم الخاصة (مثل سجلات الشراء، عادات التصفح، أنشطة وسائل التواصل الاجتماعي، إلخ) إلى DLP معينة، واختيار ما إذا كانوا سيرخصون هذه البيانات لاستخدام طرف ثالث معين؛
في PublicAI، يمكن للمستخدمين استخدام #AI 或#Web3 كعلامة تصنيف على X و@PublicAI لجمع البيانات.
حالياً، تفكر Grass و OpenLayer في إضافة هذه المرحلة الأساسية من التسمية البيانية.
قدمت Synesis مفهوم "Train2earn"، مع التركيز على جودة البيانات، حيث يمكن للمستخدمين الحصول على مكافآت من خلال تقديم بيانات مؤشرة أو تعليقات أو أشكال أخرى من المدخلات.
مشروع تصنيف البيانات Sapien يقوم بتحويل مهام التوسيم إلى لعبة، ويتيح للمستخدمين رهن النقاط لكسب المزيد من النقاط.
3، خصوصية البيانات والأمان: من المهم توضيح أن خصوصية البيانات والأمان هما مفهومين مختلفين. تتعلق خصوصية البيانات بمعالجة البيانات الحساسة، بينما يحمي الأمان المعلومات من الوصول غير المصرح به، والتخريب، والسرقة. ومن ثم، فإن مزايا تقنيات الخصوصية في Web3 وسيناريوهات التطبيق المحتملة تظهر في جانبين: (1) تدريب البيانات الحساسة؛ (2) التعاون في البيانات: يمكن لعدة مالكين للبيانات المشاركة معًا في تدريب الذكاء الاصطناعي دون الحاجة إلى مشاركة بياناتهم الأصلية.
تشمل تقنيات الخصوصية الشائعة في Web3 الحالية ما يلي:
بيئة تنفيذ موثوقة ( TEE )، مثل بروتوكول سوبر؛
التشفير المتجانس بالكامل (FHE)، مثل BasedAI، Fhenix.io أو Inco Network؛
تقنية المعرفة الصفرية (zk)، مثل بروتوكول Reclaim الذي يستخدم تقنية zkTLS، تنتج إثباتات معرفة صفرية لحركة مرور HTTPS، مما يسمح للمستخدمين باستيراد الأنشطة والسمعة وبيانات الهوية من مواقع خارجية بشكل آمن دون الكشف عن المعلومات الحساسة.
ومع ذلك، لا يزال هذا المجال في مراحله المبكرة، حيث لا يزال معظم المشاريع قيد الاستكشاف، وتتمثل إحدى المعضلات الحالية في ارتفاع تكاليف الحساب، ومن الأمثلة على ذلك: