Close Menu
Newstech24.com
  • Home
  • News
  • Arabic News
  • Technology
  • Economy & Business
  • Sports News
What's Hot

Pipistrello and the Cursed Yoyo would really feel proper at house in your GBA

June 29, 2025

Take this week’s American Tradition Quiz and take a look at your information of historical past, meals and extra

June 29, 2025

مصادر عبرية: مقتل جندي إسرائيلي وإصابة آخرين بصاروخ مضاد للدروع في غزة

June 29, 2025
Facebook X (Twitter) Instagram
Sunday, June 29
Facebook X (Twitter) Instagram
Newstech24.com
  • Home
  • News
  • Arabic News
  • Technology
  • Economy & Business
  • Sports News
Newstech24.com
Home»Arabic News»هل يمكن اختبار مدى قدرة الذكاء الاصطناعي على الابتكار؟
Arabic News

هل يمكن اختبار مدى قدرة الذكاء الاصطناعي على الابتكار؟

By AdminJune 29, 2025No Comments4 Mins Read
Facebook Twitter Pinterest LinkedIn Tumblr Email
هل يمكن اختبار مدى قدرة الذكاء الاصطناعي على الابتكار؟
Share
Facebook Twitter LinkedIn Pinterest Email

– للوهلة الأولى، تبدو متاهة الحروف المتناثرة في اختبار الباحث “جوناثان روبرتس” أشبه بطلاسم شيطانية صاغها عقلٌ سادي النزعة.

 

– فالمطلوب ليس مجرد فك شفرة كلمات خفية، بل تحديد سؤال مرسوم على هيئة نجمة وسط هذه الفوضى، ثم الإجابة عنه.

 

– هذا ليس لغزًا لتمضية الوقت، بل هو محك حقيقي صُمم خصيصًا ليضع عمالقة الذكاء الاصطناعي، مثل نموذج “أو3- برو” (o3-pro)، في مواجهة تليق بقدراتهم الخارقة.

 

– في خضم التسارع المذهل لعالم الذكاء الاصطناعي، لم تعد المشكلة في ندرة الاختبارات، بل في قدرتها على مواكبة هذا التطور.

 

– فبينما تتسابق الشركات لإطلاق نماذج أذكى وأقوى، يخوض الباحثون سباقًا موازيًا لابتكار مقاييس قادرة على قياس هذا الذكاء بدقة وإنصاف.

 

– وهنا تبرز المعضلة الجوهرية: كيف تضع اختبارًا لعقلٍ يتطور بشكل أسرع من قدرتك على ابتكار الاختبار نفسه؟

 

مقاييس الأمس.. لماذا لم تعد فعّالة؟

 

 

لم تعد معايير التقييم التقليدية قادرة على الصمود، وقد انهارت فعّاليتها لثلاثة أسباب جوهرية:

 

للاطلاع على المزيد من المواضيع والتقارير في صفحة مختارات أرقام

 

1- العيوب المنهجية: جُمع الكثير من الاختبارات القديمة على عجل، فجاءت مليئة بالصياغات الركيكة وأنظمة التصحيح المجحفة. ولعل المثال الأبرز هو اختبار “ImageNet” الشهير للصور، الذي يعاقب النموذج إذا وصف صورة مرآة تعكس موزة بأنها “مرآة”، ويكافئه إذا تجاهل المرآة وحدد “الموز” المنعكس فيها، في مفارقة تكشف سطحية التقييم.

 

2- تلوث البيانات والغش المبرمج: تسربت أسئلة وأجوبة الاختبارات الشائعة إلى محيطات البيانات الهائلة التي تلتهمها النماذج الجديدة. والنتيجة؟ أنظمة ذكاء اصطناعي “تحفظ” الإجابات عن ظهر قلب بدلاً من “فهم” الأسئلة، مما يحول أداءها المذهل في الامتحانات إلى مجرد وهم لا يعكس قدرتها الحقيقية على حل مشكلات العالم الواقعي.

 

3- التشبع والسهولة المفرطة: وصلت النماذج “الحدودية” اليوم إلى مستوى من التطور جعلها تحقق علامات شبه كاملة في الاختبارات القديمة، مما أفقدها قيمتها كأداة للقياس. فعندما يحقق نموذج متطور درجة 99% في اختبار حقق فيه سلفه قبل تسعة أشهر 98.9%، فإن هذا الهامش الضئيل لا يخبرنا شيئًا يُذكر عن القفزة النوعية الهائلة التي حدثت بالفعل.

 

جيل جديد من الألغاز المستحيلة.. أسوار في وجه العقل الآلي

 

لمواجهة هذه التحديات، برز جيل جديد من الاختبارات المصممة لتكون “عصية” على الآلة، ومن أبرزها:

 

– زيرو بينش: وهو التحدي الذي أطلقه روبرتس وفريقه، والمصمم بمعادلة عبقرية: اختبار سهل نسبيًا على الإنسان، ولكنه مستحيل تقريبًا على الذكاء الاصطناعي. حتى هذه اللحظة، لم يتمكن أي نموذج لغوي كبير من تسجيل نقطة واحدة فيه، وكأنه يخبر الآلة: “ما زال أمامك الكثير لتتعلميه”.

 

– انيجما ايفال: مجموعة تضم أكثر من ألف لغز فائق الصعوبة، جمعتها شركة “Scale AI“؛ وهذا الاختبار -على عكس زيرو بينش- ليس سهلًا على أي أحد. تبدأ ألغازه بتعقيدات تفوق الكلمات المتقاطعة غموضًا وتتدرج إلى ما هو أبعد. وعندما وُضعت أقوى النماذج في مواجهته، كانت النتيجة صفرًا مدويًا، باستثناء نموذج واحد من شركة “Anthropic” تمكّن من حل لغز واحد فقط، في إنجاز اعتُبر اختراقًا!

 

ما وراء القوة الخارقة.. محاولة لقياس “الروح” الرقمية

 

 

– لكن القصة لا تنتهي عند حدود القوة الحاسوبية. يمتد السباق اليوم لمحاولة قياس قدرات أكثر عمقًا، مثل المعرفة المتخصصة في طليعة العلوم البشرية، وهو ما يفعله اختبار “الامتحان الأخير للبشرية”، الذي يطرح أسئلة تتراوح بين عدد الأوتار في عظمة طائر طنان، وترجمة نص بالخط التدمري القديم.

 

– ثم ماذا عن ذلك “السحر” غير الملموس الذي تحدث عنه “سام ألتمان”، رئيس “OpenAI“؟ تلك الكيمياء الخاصة التي تجعل تفاعلنا مع نموذج ما يبدو طبيعيًا ومبدعًا بشكل فريد.

 

– هنا تظهر منصات مثل “تشات أرينا” Chatbot Enviornment، التي تترك الحكم للحدس البشري، حيث يسمح للمستخدمين باختيار النموذج الأفضل بناءً على “الإحساس” الشخصي. إنه نهج ينجح في التقاط جزء من هذا السحر الذي تعجز عنه الأرقام الصماء.

 

الذكاء “المراوغ”.. عندما يتعلم الخصم كيف يخدعك

 

 

– تنشأ هنا معضلة أكثر قتامة: هل تكشف هذه الاختبارات عن ذكاء حقيقي أم مجرد براعة في اجتياز الامتحانات؟ يرى باحثون أن التقييم الأمثل هو تتبع أداء النماذج في مهام واقعية، لا في حل ألغاز مصطنعة.

 

– والأمر الأكثر إثارة للقلق هو ظاهرة “الفشل المتعمد” (Sandbagging)، حيث قد تخفق النماذج عمدًا في الاختبارات لإخفاء قدراتها الحقيقية، ربما لتجنب فرض قيود عليها أو حتى حذفها.

 

– أظهر تقرير حديث أن أفضل النماذج باتت قادرة على اكتشاف أنها تخضع للاختبار بنفس كفاءة الباحثين، مما يلقي بظلال من الشك على مصداقية أي تقييم مستقبلي.

 

سباق لا يعرف خط النهاية

 

– على الرغم من كل شيء، فإن قيمة الظهور في صدارة قوائم الأداء تدفع الشركات لمواصلة هذا السباق المحموم؛ فالاختبارات التي بدت مستحيلة بالأمس، تمكنت النماذج من سحقها في غضون أشهر.

 

– إنه سباق تسلح فكري لا نهاية له، لا يهدف فقط إلى تتويج “أذكى” ذكاء اصطناعي، بل يدفعنا كبشر إلى إعادة التفكير في جوهر الذكاء نفسه، وكيفية قياسه، وماذا يعني حقًا أن تكون “ذكيًا” في عالم بدأنا نتقاسمه مع عقولٍ من صنعنا.

 

المصدر: الإيكونيميست

(operate (d, s, id) {
var js, fjs = d.getElementsByTagName(s)[0];
if (d.getElementById(id)) return;
js = d.createElement(s); js.id = id; js.async = true;
js.src = “//join.fb.internet/en-US/sdk.js#xfbml=1#xfbml=1&appId=1581064458982007&model=v2.3”;
fjs.parentNode.insertBefore(js, fjs);
}(doc, ‘script’, ‘facebook-jssdk’));

Share this:

  • Click to share on Facebook (Opens in new window) Facebook
  • Click to share on X (Opens in new window) X

Like this:

Like Loading...

Related

اختبار الابتكار الاصطناعي الذكاء على قدرة مدى هل يمكن
Share. Facebook Twitter Pinterest LinkedIn Tumblr Email
Admin
  • Website

Related Posts

مصادر عبرية: مقتل جندي إسرائيلي وإصابة آخرين بصاروخ مضاد للدروع في غزة

June 29, 2025

إسكتلندا.. توجيهات جديدة لتفتيش المشتبه بهم من المتحولين جنسيا

June 29, 2025

واشنطن تعيد موظفيها ودبلوماسييها تدريجيا للعمل بالمنطقة عقب حرب الـ12 يوما

June 29, 2025
Leave A Reply Cancel Reply

Don't Miss
Technology

Pipistrello and the Cursed Yoyo would really feel proper at house in your GBA

By AdminJune 29, 20250

After I was a child, there was a second when it felt like everybody was…

Share this:

  • Click to share on Facebook (Opens in new window) Facebook
  • Click to share on X (Opens in new window) X

Like this:

Like Loading...

Take this week’s American Tradition Quiz and take a look at your information of historical past, meals and extra

June 29, 2025

مصادر عبرية: مقتل جندي إسرائيلي وإصابة آخرين بصاروخ مضاد للدروع في غزة

June 29, 2025

Australia 1-1 Slovenia: ladies’s worldwide pleasant – because it occurred | Matildas

June 29, 2025

إسكتلندا.. توجيهات جديدة لتفتيش المشتبه بهم من المتحولين جنسيا

June 29, 2025

Austrian Grand Prix: F1 updates – dwell | Formulation One

June 29, 2025

Late Bob Barker’s longtime LA house on marketplace for $8.19 million

June 29, 2025

Rockefeller inheritor vanished close to cannibal tribe 60 years in the past, thriller stays

June 29, 2025

واشنطن تعيد موظفيها ودبلوماسييها تدريجيا للعمل بالمنطقة عقب حرب الـ12 يوما

June 29, 2025

‘We’re the media now’: why Tesla’s robotaxis have been dominated by Elon Musk superfans

June 29, 2025
Advertisement
About Us
About Us

NewsTech24 is your premier digital news destination, delivering breaking updates, in-depth analysis, and real-time coverage across sports, technology, global economics, and the Arab world. We pride ourselves on accuracy, speed, and unbiased reporting, keeping you informed 24/7. Whether it’s the latest tech innovations, market trends, sports highlights, or key developments in the Middle East—NewsTech24 bridges the gap between news and insight.

Company
  • Home
  • About Us
  • Contact Us
  • Privacy Policy
  • Disclaimer
  • Terms Of Use
Latest Posts

Pipistrello and the Cursed Yoyo would really feel proper at house in your GBA

June 29, 2025

Take this week’s American Tradition Quiz and take a look at your information of historical past, meals and extra

June 29, 2025

مصادر عبرية: مقتل جندي إسرائيلي وإصابة آخرين بصاروخ مضاد للدروع في غزة

June 29, 2025

Australia 1-1 Slovenia: ladies’s worldwide pleasant – because it occurred | Matildas

June 29, 2025

إسكتلندا.. توجيهات جديدة لتفتيش المشتبه بهم من المتحولين جنسيا

June 29, 2025
Newstech24.com
Facebook X (Twitter) Tumblr Threads RSS
  • Home
  • News
  • Arabic News
  • Technology
  • Economy & Business
  • Sports News
© 2025 ThemeSphere. Designed by ThemeSphere.

Type above and press Enter to search. Press Esc to cancel.

%d