كيف تكتشف الأصوات المفبركة بالذكاء الاصطناعي؟ 7 علامات تحذيرية

الأصوات المقبركة بالذكاء الاصطناعي أصبحت أقرب من أي وقت مضى للأصوات البشرية، وهو ما يثير مخاوف الاحتيال والخداع، فقد تُستخدم هذه التقنية في المكالمات المزيفة، أو في إنتاج مقاطع صوتية تُنسب إلى أشخاص لم يتحدثوا بها أصلًا.

في هذا المقال نوضح لك النقاط التي تساعدك على كشف الأصوات المفبركة، وتجنب الاحتيال. لقد أصبح تقليد الأصوات بالذكاء الاصطناعي دقيقًا لدرجة مخيفة، مما يطرح تحديًا جديدًا على الذكاء الاصطناعي والأمن الرقمي. إن القدرة على التمييز بين الصوت البشري والاصطناعي لم تعد مهارة تقنية، بل ضرورة لحماية أنفسنا. هذا الدليل سيمنحك الأدوات اللازمة لكشف الأصوات المزيفة بالذكاء الاصطناعي.

في عصر الذكاء الاصطناعي، أصبح سهلًا صناعة وتقليد الأصوات البشرية بطريقة حرفية ومتقنة تجعل الأصوات المفبركة تبدو كأنها أصوات بشرية طبيعية، وهو ما يمكن استخدامه في كثير من الحيل والأمور الخداعية، سواء كانت بغرض التسلية والترفيه أو للأمور الفنية أو حتى للأغراض الاحتيالية وغير القانونية، وهذا يطرح سؤالًا مهمًا هو: كيف يمكن التعرف على الأصوات المولَّدة بالذكاء الاصطناعي؟

لماذا يعد كشف الخداع الصوتي أمرًا حيويًّا؟

قبل أن نتعرف على العلامات، من المهم أن نفهم خطورة الأصوات المفبركة بالذكاء الاصطناعي. إنها ليست أداة للتسلية فحسب، بل أصبحت سلاحًا في أيدي المحتالين والمضللين، وتتمثل مخاطرها في:

أهمية كشف الخداع الصوتي

  • الاحتيال الصوتي بالذكاء الاصطناعي: قد تتلقى مكالمة بصوت مفبرك لأحد أفراد أسرتك يدعي أنه في ورطة ويحتاج إلى تحويل مالي عاجل.

  • التضليل الإعلامي والسياسي: يمكن استخدام هذه التقنية لإنشاء تسجيلات صوتية مزيفة لسياسيين أو مسؤولين لنشر الفوضى أو التأثير في الرأي العام.

  • الابتزاز والتشهير: يمكن فبركة تسجيلات صوتية مسيئة لأي شخص بهدف ابتزازه أو تدمير سمعته.

لهذه الأسباب، أصبح كشف الخداع الصوتي مهارة أساسية للنجاة في العصر الرقمي.

علامات الصوت المولّد بالذكاء الاصطناعي: دليل التمييز بين الصوت البشري والاصطناعي

ربما كان تقليد الأصوات أمرًا مدهشًا في الماضي، فقد كان يحتاج أشخاصًا أصحاب مهارات كبيرة في تقليد الأصوات، وهو ما كان يصيب الناس بالذهول والدهشة. إلا إن انتشار أدوات الذكاء الاصطناعي التي تستخدم تقنيات ذكاء حاسوبية شديدة التطور، أدى إلى ظهور كثير من التطبيقات التي تنتج الأصوات التي تقترب كثيرًا من الأصوات البشرية. إلا إنه توجد بعض علامات الصوت المفبرك التي يمكن بها التمييز بين الصوت البشري والصوت المولَّد بالذكاء الاصطناعي، ومن أهم هذه العلامات ما يلي:

إيقاع الكلام وفترات التوقف غير الطبيعية

من الطبيعي في الحديث البشري وجود توقفات بين الجمل وبين بعض الكلمات، وهو أمر يشترك فيه جميع البشر بطرق مختلفة، لذا فإن غياب فترات التوقف الطبيعي قد يكون علامة مهمة أن الحوار أو الحديث ليس بشريًّا وأنه مولد بالذكاء الاصطناعي.

فترات التوقف غير الطبيعية

وعلى الرغم من وجود كثير من التطبيقات الحديثة التي تحاول تدارك ذلك العيب لكي تضفي على الكلام الطبيعة البشرية، فإن كثيرًا من التطبيقات والأدوات التي تعاني تلك المشكلة.

حتى التطبيقات والأدوات التي تحاول وضع بعض التفاصيل البشرية مثل التنفس والتوقف بين الكلمات والجمل قد تبدو غير منطقية، فإن التوقفات البشرية تتأثر كثيرًا بطبيعة الشخص الذي يتحدث، إضافة إلى وجود مقاطعات طبيعية، وهو ما لم يتوصل إليه الذكاء الاصطناعي بعد. وبذلك يمكن للشخص الذي يعي الأمر أن يكتشف أن الأصوات التي يستمع إليها هي أصوات مولدة بالذكاء الاصطناعي وليست أصواتًا بشرية.

نطق الكلمات بأسلوب آلي ومتكرر

مع الجهد الكبير الذي تصنعه شركات الذكاء الاصطناعي لكي يبدو النص المنطوق أقرب إلى النطق البشري، فإن هناك عائقًا كبيرًا يتمثل في أن الروبوت الذي يعمل بالذكاء الاصطناعي لا يفهم اللغة التي ينطقها كما يفهمها أصحابها، لذا مهما بلغت براعته بالخوارزميات المعقدة فإنه قد يخطئ في نطق بعض الكلمات التي تثبت أن الحوار أو الحديث بالذكاء الاصطناعي.

وحينئذ يستطيع الشخص أن يركز مع الحوار أو الحديث ليعثر على بعض الأخطاء في النطق. فيمكن للذكاء الاصطناعي أن ينطق الكلمة بطريقة معينة في جملة وينطقها بالطريقة نفسها في جملة مختلفة؛ وهذا يعود إلى عدم وعي الذكاء الاصطناعي باللغة أو فهمها كما يفهمها المتحدثون بها من البشر. فينطق المتحدث البشري الكلمة بالطريقة التي تتناسب مع المعنى والسياق، ولكن الذكاء الاصطناعي لا يفهم ذلك، فهو ينطق الكلمة كما هي في كل الأحوال.

وإذا أردنا أن نوضح الأمر بمثال، فإن كلمة «ذهب» تحمل معنى الذهب المعدن المعروف، وتحمل أيضًا معنى «ذَهَب» أي الذهاب إلى مكان ما. وهو ما يمكن للبشر فهمه من سياق الجملة. ولكن الذكاء الاصطناعي لا يفهم ذلك، فهو ينطق كلمة «ذهب» بالطريقة نفسها في كلا السياقين. وهذا الأمر يظهر في اللغة العربية في كثير من الكلمات التي تحمل معنيين أو أكثر. ولذا يصبح كشف الأصوات المولدة بالذكاء الاصطناعي في اللغة العربية أكثر سهولة؛ نظرًا لأن الروبوتات قد تدربت  أساسًا على اللغة الإنجليزية.

ومن التجارب المهمة التي يمكن بها كشف الأصوات المولَّدة بالذكاء الاصطناعي بنطق الكلمات هو أن يطلب شخص ما من أحدث نماذج (شات جي بي تي) التي تعمل بالذكاء الاصطناعي أن يقرأ له بعض القرآن بالتجويد، وهو ما سيفضح أداة الذكاء الاصطناعي التي ستخطئ في كثير من الكلمات مع وجودها في سياقات مختلفة، على الرغم من أن نموذج الذكاء الاصطناعي يُعد هو الأحدث والأكثر تطورًا.

غياب العمق العاطفي

في السنوات الأخيرة، كان العمل مكثف لكي تصل خوارزميات الذكاء الاصطناعي إلى القدرة على خلق نبرة عاطفية تبدو أقرب للنبرة البشرية. وهو أمر يتميز به البشر عن الآلات، ويختلف من شخص لآخر، ويختلف حسب طبيعة المحادثة والمشاعر التي تحملها الكلمات والجمل. وقد تتغير النبرة داخل الحوار مع تغير الموضوع أو ارتفاع وتيرة الكلام أو انخفاضه في النقاش والحديث والرد، وهو ما لم تستطع أدوات الذكاء الاصطناعي أن تصل إليه بالدرجة التي تجعل الأصوات المقلدة تتسق تمامًا مع الأصوات الطبيعية.

لذا الاستماع إلى الصوت المولد بالذكاء الاصطناعي بتركيز على الجانب العاطفي يساعد كثيرًا على الكشف عن كونه صوتًا مفبركًا وليس بشريًّا، فلا تتطابق المشاعر والعواطف التي جرى دمجها مع الصوت مع مضمون الكلمات والجمل، ومع المشاعر الطبيعية التي يجب أن يشعر بها الشخص الذي يتحدث ويحمل قدرًا من الأفكار والمشاعر والانطباعات والاتجاهات التي تظهر في كلامه في نبرة صوته.

وعلى سبيل المثال، فإن الاستماع إلى المحادثات والبودكاست المولدة بالذكاء الاصطناعي ستُظهر غياب المشاعر البشرية المناسبة التي تتوافق مع الجمل ومع سياق الحديث، من مشاعر الدهشة والرغبة في السخرية، ومشاعر الغضب، حتى مشاعر الاعتراض وعدم الرضا على ما يقال، أو مشاعر الانبهار والإعجاب التي تختلط مع الكلمات والجمل في أثناء الحديث، وهو ما يمكن منه تمييز الأصوات المولدة بالذكاء الاصطناعي عن الأصوات البشرية.

اختبار تسريع الصوت

من الحيل المعروفة التي يلجأ إليها كثيرون للتعرف على الأصوات المولَّدة بالذكاء الاصطناعي هي حيلة تسريع الصوت عن سرعة التشغيل العادية، (بسرعة 1.5x أو 2x)، وهو ما يوضح كثيرًا من النقاط التي يمكن بها تمييز الأصوات المصنوعة بالذكاء الاصطناعي عن الأصوات البشرية. فيبدو الصوت المولد بالذكاء الاصطناعي غير طبيعي بالمرة، في حين يبدو الصوت البشري صوتًا طبيعيًا لشخص يتحدث بسرعة قليلًا، وهو ما يمكن أن يواجهه الشخص في محادثاته اليومية مع البشر.

اختبار تسريع الصوت

في الصوت الذي جرى فبركته بالذكاء الاصطناعي، تؤدي سرعة التشغيل إلى تحول الصوت إلى نبرة آلية يُستبعد معها احتمال أن يكون المتحدث بشريًا، خاصة عندما يتعلق الأمر بالمقاطع الغنائية التي يتم توليدها بالذكاء الاصطناعي؛ لذا إذا كان الصوت يبدو طبيعيًا في سرعة التشغيل العادية، يمكن اللجوء إلى تسريع عملية تشغيل الصوت للكشف عن كونه صوتًا مولدًا بالذكاء الاصطناعي.

نقاء الصوت المبالغ فيه

على الرغم من أن نقاء الصوت يعد ميزة كبيرة في التسجيلات والفيديوهات، ويتم استخدام كثير من الأدوات للعمل على تنقية الصوت وإبعاد الضوضاء من الخلفية، فإن الأصوات البشرية في التسجيلات لابد أن تحتوي قدرًا من التداخل والضوضاء، حتى ولو كان التسجيل في استوديو ذي قدرات كبيرة. ويمكن أيضًا أن تحتوي الأصوات البشرية على بعض الصدى أو الطنين نتيجة ارتداد الأصوات من الجدران أو عيوب في الميكروفونات، وهي مجموعة من التفاصيل التي تضفي على الصوت الطبيعة البشرية.

أما في الأصوات التي يحدث تسجيلها بالذكاء الاصطناعي، فإنها تكون نقية من الضوضاء ومن عيوب التسجيل على نحو واضح، وهو ما يعد علامة على أن هذه الأصوات غير بشرية؛ لذا يحتاج الأمر إلى التركيز في نقاء الصوت ومقارنته بالأصوات البشرية المسجلة. وعلى الرغم من أن كثيرًا من أدوات الذكاء الاصطناعي التي تحاول وضع لمسات وتفاصيل بشرية على التسجيلات؛ فإنها تبدو تفاصيل غير عميقة ويسهل كشفها.

التسجيلات البشرية غالبًا ما تتأثر بالمحيط والبيئة التي يوجد فيها البشر وهم يتحدثون ويسجلون الحوارات، وهو أمر يختلف من الغرف الصغيرة والكبيرة والأماكن المفتوحة والمغلقة، لكن التسجيلات الاصطناعية تبدو وكأنها تسجيلات في بيئة خالية من الهواء، وهو أمر غير بشري ويسهل كشفه، خاصة للأذن الخبيرة والأشخاص الذين يملكون قدرة على الملاحظة واكتشاف التفاصيل.

وجود تشوهات رقمية خفية

في بعض الأحيان لا سيما في الأصوات المفبركة الأقل جودة، يمكنك سماع تشوهات رقمية خفية عند الاستماع بعناية باستخدام سماعات رأس جيدة. قد تكون هذه التشوهات على شكل طنين معدني خفيف جدًا في الخلفية، أو تكسير صغير في الصوت عند نطق حروف معينة، وهي بقايا من عملية المعالجة الرقمية.

الحدس البشري

في التعامل مع الذكاء الاصطناعي بالبرامج والأدوات والتطبيقات والمهام التي يؤديها لمساعدة البشر، يجب أن يكون لدى الشخص حدس خاص به يستعمله باستمرار وينميه، لكي يستطيع أن يعتمد عليه في بعض الأوقات في التفريق بين ما هو بشري وما هو اصطناعي. وهو أمر يأتي بالتدريب والتطوير وعدم الاعتماد فقط على التكنولوجيا التي قد تخدعنا بتطورها وتعقيدها.

الحدس البشري

لذا لا بد أن ينمي الشخص ما هو بشري ويحافظ عليه من مشاعر وأحاسيس ورؤى وأفكار ومعتقدات وحدس قوي، لكي لا يصبح الإنسان أشبه بالآلة أو بأدوات الذكاء الاصطناعي. وفي هذه الحالة، لن يستطيع أن ينافس التكنولوجيا، وهو ما يجعلنا نقول إن الحدس الشخصي قد يكون إحدى الأدوات المهمة التي تمكِّن الإنسان من التفريق بين الأصوات البشرية والأصوات التي جرى فبركتها بالذكاء الاصطناعي، بجانب العلامات الأخرى الموضحة في المقال.

قائمة تحقق سريعة لكشف الأصوات المفبركة

  • هل يبدو إيقاع الكلام آليًا جدًا؟

  • هل النبرة العاطفية مسطحة أو غير مناسبة للسياق؟

  • هل هناك أخطاء غريبة في نطق الكلمات؟

  • هل يبدو الصوت "نظيفًا" بشكل مبالغ فيه وخاليًا من أي ضوضاء خلفية؟

  • جرّب تسريع الصوت، هل يبدو كروبوت؟

  • هل يطلب منك المتحدث القيام بإجراء مالي عاجل بناءً على قصة عاطفية؟ كن حذرًا.

الاستماع النقدي مهارة أمان

في عصر تقليد الأصوات بالذكاء الاصطناعي، أصبحت مهارة الاستماع النقدي لا تقل أهمية عن التفكير النقدي. لا تصدق كل ما تسمعه، خاصة إذا كان الموقف يتضمن طلبات مالية عاجلة أو معلومات مثيرة للجدل. كن متشككًا، استخدم هذه العلامات أدوات للتحقق، وعند الشك، تحقق دائمًا من المصدر عبر قناة تواصل أخرى موثوقة، إن حماية أذنيك وعقلك هي خط الدفاع الأول في معركة الذكاء الاصطناعي والأمن الرقمي.

وفي النهاية فإن تطور أدوات الذكاء الاصطناعي بقدر ما تمنح كثيرًا من الأشخاص القدرة على عمل الحيل وفبركة الأصوات والصور، فإنها أيضًا قد تكون وسيلة لاكتشاف تلك الحيل، لكن الأمر يحتاج إلى مواكبة التطور ومعرفة الجديد أولًا بأول حتى لا تبعد المسافة كثيرًا بين الشخص والواقع الذي يدور حوله.

وفي نهاية المقال، نأمل أن نكون قد قدمنا لك المتعة والإضافة، ويسعدنا كثيرًا أن تشاركنا رأيك في التعليقات، ومشاركة المقال على مواقع التواصل لتعم الفائدة الجميع.

ملاحظة: المقالات والمشاركات والتعليقات المنشورة بأسماء أصحابها أو بأسماء مستعارة لا تمثل الرأي الرسمي لجوَّك بل تمثل وجهة نظر كاتبها ونحن لا نتحمل أي مسؤولية أو ضرر بسبب هذا المحتوى.

ما رأيك بما قرأت؟
إذا أعجبك المقال اضغط زر متابعة الكاتب وشارك المقال مع أصدقائك على مواقع التواصل الاجتماعي حتى يتسنى للكاتب نشر المزيد من المقالات الجديدة والمفيدة والإيجابية..

تعليقات

يجب عليك تسجيل الدخول أولاً لإضافة تعليق.

مقالات ذات صلة