يقوم الذكاء الاصطناعي بفك تشفير الكلام من نشاط الدماغ باستخدام التسجيلات غير الجراحية.
تم النشر في ١٣ سبتمبر ٢٠٢٢ | تمت المراجعة بواسطة Kaja Perina
الكاتبة: Cami Rosso
د. سالم موسى القحطاني
تقدم قدرات التعرف على الأنماط المتقدمة للتعلم العميق بالذكاء الاصطناعي بصيص أمل جديد لحل غير جراحي لمساعدة المرضى غير القادرين على التحدث بسبب الأمراض التنكسية العصبية أو إصابة الدماغ أو النخاع الشوكي. أظهرت دراسة جديدة أجراها باحثون منتسبون إلى Meta AI كيف يمكن للتعلم العميق للذكاء الاصطناعي أن يفك تشفير الكلام من التسجيلات غير االجراحية لنشاط الدماغ ، وهي خطوة إلى الأمام في توفير بديل للحلول التي تتطلب جراحة دماغية مفتوحة لزرع أجهزة واجهة بين الدماغ والكمبيوتر.
كتب فريق البحث المؤلف من ألكسندر ديفوس وشارلوت كوتشيتو وجيريمي رابين وأوري كابيلي وجان ريمي كينج: "إن فك شفرة اللغة من نشاط الدماغ هو هدف طال انتظاره في كل من الرعاية الصحية وعلم الأعصاب". "تم الوصول إلى المعالم الرئيسية مؤخرًا بفضل الأجهزة داخل الجمجمة: بدأت خطوط الأنابيب الخاصة بموضوع معين والمدربة على استجابات الدماغ لمهام اللغة الأساسية في فك شفرة الميزات القابلة للتفسير بكفاءة (مثل الحروف والكلمات والمخططات الطيفية). ومع ذلك ، فإن توسيع نطاق هذا النهج في الكلام الطبيعي وتسجيلات الدماغ غير جراحي لا يزال يمثل تحديًا كبيرًا ".
لمواجهة هذا التحدي ، استخدم باحثو Meta AI التعلم العميق للذكاء الاصطناعي ، وتحديداً الشبكة العصبية التلافيفية (CNN) ، للمساعدة في فك شفرة نشاط الدماغ باستخدام البيانات التي تم التقاطها دون الحاجة إلى جراحة دماغ مفتوحة. كانت خوارزمية التعلم العميق عبارة عن نموذج مفتوح المصدر خاضع للإشراف الذاتي يسمى wav2vec 2.0 تم تطويره في عام 2020 من قبل فريق الذكاء الاصطناعي بواسطة ال Facebook (الآن Meta) المكون من Alexei Baevski و Henry Zhou وعبد الرحمن محمد ومايكل أولي.
جمعت الدراسة بيانات من 169 مشاركًا يتمتعون بصحة جيدة كانوا يستمعون بشكل سلبي إلى الكتب الصوتية والجمل بلغاتهم الأصلية سواء الإنجليزية أو الهولندية بينما تم تسجيل نشاطهم الدماغي بشكل غير موسع إما باستخدام تخطيط الدماغ المغناطيسي (MEG) أو تخطيط كهربية الدماغ (EEG). ثم تم استخدام هذه البيانات كمدخلات في نموذج الذكاء الاصطناعي للبحث عن أنماط في البيانات عالية الأبعاد. الهدف هو أن يتنبأ الذكاء الاصطناعي بما كان المشاركون في الدراسة يستمعون إليه من عمليات مسح الدماغ غير الجراحي لنشاطهم العصبي.
وجد الباحثون أن الخوارزمية تعمل بشكل أفضل مع مجموعات بيانات MEG مقارنة بمجموعات بيانات EEG. بالنسبة لمجموعات بيانات MEG ، توقع النموذج دقة أعلى 10 تصل إلى 72.5٪ من ثلاث ثوانٍ من نشاط الدماغ من بين أكثر من 1590 مقطعًا متميزًا. تفوقت خوارزمية الذكاء الاصطناعي في الأداء على خط الأساس العشوائي في فك تشفير مجموعات بيانات مخطط كهربية الدماغ ، ولكنها وصلت فقط إلى 19.1 في المائة من أكثر من 2600 مقطع.
فيما يتعلق بالتأثير المجتمعي ، حذر باحث Meta AI ، "على الرغم من أن هذه النتائج تبشر كثيرًا بتطوير نظام آمن وقابل للتطوير لمساعدة المرضى الذين يعانون من عجز في التواصل مع الاخرين، ولذا يجب أن يظل المجتمع العلمي يقظًا لأنه لن يتم تكييفه لفك تشفير الدماغ لاشارات دون موافقة المشاركين ".
يشير باحثو منظمة العفو الدولية أيضًا إلى أنه على عكس المؤشرات الحيوية الأخرى مثل ملامح الوجه والحمض النووي وبصمات الأصابع ، لا يمكن اخذ تسجيلات نشاط الدماغ من EEG و MEG دون علم المشاركين بها.
المصدر:
AI Researchers Decode Speech from Thoughts without Brain Surgery | Psychology Today
About the Author
Cami Rosso writes about science, technology, innovation, and leadership.
Online:
.