في إنجاز علمي يمثل قفزة نوعية في مجال واجهات التخاطب بين الدماغ والحاسوب، التي تُعرف اختصارًا باسم (BCIs)، كشف فريق بحثي مشترك من جامعة كاليفورنيا في بيركلي، وجامعة كاليفورنيا في سان فرانسيسكو عن طريقة مبتكرة لاستعادة القدرة على إنتاج كلام طبيعي للأفراد الذين يعانون شلل حاد يؤثر بشدة في قدرتهم على التواصل اللفظي.
ويعالج هذا العمل البحثي تحديًا ظل قائمًا لمدة طويلة في مجال الأطراف الاصطناعية العصبية للكلام، وهو طول زمن الانتقال، الذي يفصل بين محاولة الشخص التعبير عن كلمة ما، والوقت الذي يُنتج فيه الصوت المسموع فعليًا، ومن خلال الاستفادة من أحدث التطورات والتقنيات المتقدمة في مجال النمذجة القائمة على الذكاء الاصطناعي، طور الباحثون طريقة بث فريدة تعمل على تجميع الإشارات الدماغية المعقدة وتحويلها إلى كلام مسموع في وقت قريب جدًا من الوقت الفعلي لمحاولة التحدث.
وقد نُشرت نتائج هذا البحث الرائد في دورية (Nature Neuroscience) المرموقة، مما يؤكد أهميته العلمية، وتمثل هذه التقنية الجديدة خطوة حاسمة ومبشرة نحو تمكين التواصل الفعال للأشخاص الذين فقدوا القدرة على الكلام نتيجة لحالات مرضية أو إصابات خطيرة.
حل تحدي التأخير في أجهزة الكلام العصبية:

لطالما شكل زمن الانتقال، أو التأخير الزمني بين محاولة الشخص المصاب التحدث وبين إنتاج الصوت الفعلي، عقبة كبيرة أمام فعالية الأطراف الاصطناعية العصبية للكلام، فالتأخير الملحوظ كان يجعل التواصل بطيئًا وغير طبيعي، مما يقلل من فائدة هذه التقنيات في الحياة اليومية.
ولكن الفريق البحثي في جامعة كاليفورنيا نجح في تذليل هذه العقبة باستخدام أحدث التطورات في مجال النمذجة القائمة على الذكاء الاصطناعي، فقد طوروا طريقة بث مبتكرة تعمل على تحليل الإشارات الدماغية وتحويلها إلى كلام مسموع لحظيًا، مما يضفي على عملية التواصل سلاسة وطبيعية غير مسبوقة.
وقد أكد الدكتور جوبالا أنومانشيبالي، الأستاذ المساعد في الهندسة الكهربائية وعلوم الحاسوب في جامعة كاليفورنيا في بيركلي، والباحث الرئيسي المشارك في الدراسة، أهمية هذا الإنجاز من خلال مقارنته بقدرات الأجهزة الذكية الشائعة قائلًا: “يمنح نهجنا في البث المباشر الأطراف الاصطناعية العصبية سرعة فك تشفير الكلام نفسها، التي تتمتع بها المساعدات الصوتية، مثل: (أليكسا) Alexa و(سيري) Siri، فقد اكتشفنا أننا نستطيع فك شفرة البيانات العصبية باستخدام خوارزميات مشابهة تحقيق بث صوتي شبه متزامن لأول مرة، مما أثمر عن توليف كلام أكثر طبيعية وطلاقة”.
ومن جانبه، أكد جراح الأعصاب الدكتور إدوارد تشانج، الباحث الرئيسي الأول المشارك في هذه الدراسة، الأهمية القصوى لهذا الإنجاز العلمي، مشددًا على أن هذه التقنية الجديدة تحمل في طياتها إمكانيات كبيرة لإحداث نقلة نوعية في جودة حياة الأفراد الذين يواجهون تحديات جسيمة نتيجة الشلل الشديد، الذي يعيق قدرتهم الأساسية على التواصل عبر الكلام.
ويقود الدكتور تشانج حاليًا التجربة السريرية المتقدمة التي تجري فعالياتها في جامعة كاليفورنيا في سان فرانسيسكو، والتي تعتمد على استخدام مصفوفات دقيقة ومتقنة التصميم تتألف من أقطاب كهربائية عالية الكثافة تتيح تسجيل النشاط العصبي بطريقة مباشرة وفورية من سطح الدماغ، مما يوفر بيانات عصبية دقيقة وضرورية لتدريب نماذج الذكاء الاصطناعي.
وقد عبر عن تفاؤله بشأن المستقبل القريب، قائلًا: “من المثير للإعجاب أن تعمل أحدث التطورات في مجال الذكاء الاصطناعي على تسريع واجهات التخاطب بين الدماغ والحاسوب بنحو كبير للاستخدام العملي في العالم الحقيقي في المستقبل القريب”.
ولإثبات مرونة تقنيتهم، أظهر الباحثون أن هذا نهجهم الجديد لا يقتصر على نوع واحد من واجهات استشعار الدماغ، فقد نجحوا في تطبيق الخوارزمية نفسها بكفاءة على أنواع أخرى من الواجهات، بما يشمل: مصفوفات الأقطاب الكهربائية الدقيقة (MEAs)، التي تخترق سطح الدماغ، أو التسجيلات غير الجراحية (sEMG)، التي تستخدم أجهزة استشعار على الوجه لقياس نشاط العضلات.
وفي هذا السياق، أوضحت كايلو ليتلجون، الطالبة في قسم الهندسة الكهربائية وعلوم الحاسوب في جامعة كاليفورنيا في بيركلي، والمؤلفة المشاركة في الدراسة: “من خلال إثبات دقة توليد الصوت من إشارات الدماغ على مجموعات بيانات أخرى للكلام الصامت، أظهرنا أن هذه التقنية ليست حصرية لنوع واحد من الأجهزة، ويمكن استخدام الخوارزمية نفسها على طرق إدخال متنوعة طالما توفرت إشارة جيدة”.
كيف تعمل واجهة التخاطب بين الدماغ والحاسوب الجديدة؟
تعتمد واجهة التخاطب بين الدماغ والحاسوب الجديدة على تسجيل النشاط العصبي من القشرة الحركية، وهي المنطقة المسؤولة عن التحكم في إنتاج الكلام، ثم يُستخدم الذكاء الاصطناعي لفك تشفير هذه البيانات وتحويلها إلى كلام.
ويوضح تشول جون تشو، طالب الدكتوراه في الهندسة الكهربائية وعلوم الحاسوب في جامعة كاليفورنيا في بيركلي والمؤلف المشارك في الدراسة، أن العملية تبدأ باعتراض الإشارات العصبية في المرحلة التي تتحول فيها الفكرة إلى عملية نطق، وتحديدًا في منتصف عملية التحكم الحركي هذه، لذلك، ما نقوم بفك تشفيره يحدث بعد اكتمال عملية التفكير، وبعد أن نكون قد قررنا ما نريد قوله، واخترنا الكلمات التي سنستخدمها، وحددنا كيفية تحريك عضلات جهازنا الصوتي.
تجاوز قيود النطق.. الذكاء الاصطناعي يسد فجوة التواصل:
لجمع البيانات العصبية الضرورية لتدريب الخوارزمية المبتكرة، اتبع الباحثون منهجية دقيقة، إذ طلبوا من المشاركة المتطوعة التي تُدعى (آن)، النظر إلى مطالبات نصية تظهر على الشاشة، مثل: “مرحبًا، كيف حالك؟”، ثم محاولة نطقها بصمت تام، دون إصدار أي صوت مسموع على الإطلاق.
وقد مكنت هذه الخطوة الباحثين من إنشاء رابط دقيق ومحدد بين الوحدات الزمنية المنفصلة والمتميزة للنشاط العصبي الذي تولده آن في دماغها، وبين الجملة المستهدفة المحددة التي كانت تبذل جهدًا ذهنيًا لنطقها. ونظرًا إلى أن (آن) لا تقدر على إصدار أي صوت، واجه الباحثون تحديًا في الحصول على أي تسجيل صوتي مستهدف، أو أي شكل من أشكال الناتج الصوتي الفعلي الذي يمكنهم استخدامه كمرجع أساسي لربط البيانات العصبية التي جُمعت كمدخلات وتحليلها.
ولكنهم تغلبوا على هذه المشكلة باستخدام الذكاء الاصطناعي لتعويض النقص في البيانات الصوتية الفعلية، فقد استخدموا نموذجًا صوتيًا مدربًا سابقًا لتحويل النص إلى كلام، كما استخدموا صوت آن قبل إصابتها لجعل الصوت الناتج أقرب إلى صوتها الحقيقي.
بث الكلام لحظيًا:
لقد واجه الباحثون في دراستهم السابقة لواجهة التخاطب بين الدماغ والحاسوب زمن انتقال طويل في فك التشفير، وصل إلى نحو 8 ثوانٍ لفك تشفير جملة واحدة، أما الآن فقد نجح الفريق عبر نهج البث الجديد في تقليص هذا التأخير إلى ما يقرب من ثانية واحدة، مما يتيح إخراج الصوت فور محاولة الشخص التحدث.
إذ يمكن توليد أول صوت خلال ثانية واحدة فقط من بث الإشارة التي تعكس نية النطق، كما أن الجهاز قادر على فك تشفير الكلام بشكل مستمر، مما يسمح للمريضة آن بمواصلة الحديث دون انقطاع، والأهم من ذلك، أن هذه السرعة المتزايدة لم تأت على حساب الدقة، إذ حافظت الواجهة الحاسوبية الجديدة على المستوى العالي نفسه من دقة فك التشفير الذي تحقق في النهج السابق غير القائم على البث.
تجاوز التكرار الحرفي.. الذكاء الاصطناعي يتعلم جوهر اللغة:
للتأكد من أن النموذج لا يعتمد فقط على مطابقة الأنماط وتكرار أجزاء من بيانات التدريب، اختبر الباحثون أيضًا قدرته على توليف كلمات لم تكن جزءًا من مفردات مجموعة بيانات التدريب، باستخدام 26 كلمة نادرة من الأبجدية الصوتية لحلف شمال الأطلسي، وأثبتت النتائج أن نموذج الذكاء الاصطناعي قادر على التعامل مع هذه الحالات بكفاءة، مما يدل على أنه يتعلم بالفعل اللبنات الأساسية للصوت أو الكلام، وليس مجرد تكرار كلمات محفوظة.
وقد شاركت المريصة (آن)، التي شاركت أيضًا في دراسة سابقة عام 2023، الباحثين تجربتها الشخصية مع نهج التوليف الجديد القائم على البث مقارنةً بالطريقة السابقة لفك تشفير النص إلى كلام، وأوضحت أن نهج البث الجديد منحها شعورًا أكبر بالتحكم الإرادي في عملية التواصل، كما أن سماع صوتها في وقت يقارب الواقع الفعلي عزز بنحو كبير إحساسها بجسدها والاتصال بكلامها.
التطورات المستقبلية:
يمثل هذا الإنجاز الذي حققه فريق من الباحثين في جامعة كاليفورنيا خطوة مهمة نحو تحقيق هدف إنتاج كلام طبيعي وسلس باستخدام واجهات التخاطب بين الدماغ والحاسوب، مما يضع أساسًا متينًا لتطورات مستقبلية أكثر ابتكارًا.
وقد أكد الدكتور جون تشو أن إطار العمل الجديد يمثل إنجازًا كبيرًا، معربًا عن تفاؤله بإمكانية تحقيق تقدم على جميع المستويات، بما يشمل تطوير الخوارزميات لجعل توليد الكلام أفضل وأسرع.
ويركز الباحثون أيضًا في إضافة المزيد من القدرة التعبيرية إلى الصوت الناتج ليعكس التغيرات في النبرة والحدة والجهارة التي تحدث أثناء الكلام، مثل تلك التي تصاحب التحدث بحماس.
وفي سياق أوسع، شهد مجال تطوير واجهات التخاطب بين الدماغ والحاسوب تقدمًا ملحوظًا خلال السنوات القليلة الماضية، وقد تجلى هذا التقدم في المساعي الحثيثة التي تبذلها العديد من الشركات المتخصصة بهدف ابتكار تقنيات متطورة تسعى إلى تعزيز آليات التواصل البشري بنحو جذري، بالإضافة إلى معالجة مجموعة متنوعة من التحديات الطبية المعقدة التي تواجه الأفراد.
فقد كشفت شركة (Paradromics) خلال شهر فبراير الماضي عن واجهة الدماغ الحاسوبية المتطورة للغاية، التي أطلقت عليها اسم (Connexus)، كما تواصل شركة (نيورالينك) Neuralink، المملوكة لإيلون ماسك، جهودها المكثفة لتطوير شريحتها الدماغية التي تحمل اسم (N1). ويُبرز هذا التقدم المتسارع حدة المنافسة المتزايدة التي يشهدها هذا المجال التكنولوجي الواعد.
نسخ الرابط تم نسخ الرابط
ملحوظة: مضمون هذا الخبر تم كتابته بواسطة البوابة العربية للأخبار التقنية ولا يعبر عن وجهة نظر مصر اليوم وانما تم نقله بمحتواه كما هو من البوابة العربية للأخبار التقنية ونحن غير مسئولين عن محتوى الخبر والعهدة علي المصدر السابق ذكرة.