Close Menu
Newstech24.com
  • Home
  • News
  • Arabic News
  • Technology
  • Economy & Business
  • Sports News
What's Hot

Jake Paul will get referred to as out after win over Julio Cesar Chavez Jr

June 29, 2025

How Wiegman’s ‘new England’ have developed forward of Euro 2025

June 29, 2025

Utah Sen. Lee withdraws public land sale provision from GOP tax invoice

June 29, 2025
Facebook X (Twitter) Instagram
Sunday, June 29
Facebook X (Twitter) Instagram
Newstech24.com
  • Home
  • News
  • Arabic News
  • Technology
  • Economy & Business
  • Sports News
Newstech24.com
Home»Arabic News»هل يمكن اختبار مدى قدرة الذكاء الاصطناعي على الابتكار؟
Arabic News

هل يمكن اختبار مدى قدرة الذكاء الاصطناعي على الابتكار؟

By AdminJune 29, 2025No Comments4 Mins Read
Facebook Twitter Pinterest LinkedIn Tumblr Email
هل يمكن اختبار مدى قدرة الذكاء الاصطناعي على الابتكار؟
Share
Facebook Twitter LinkedIn Pinterest Email

– للوهلة الأولى، تبدو متاهة الحروف المتناثرة في اختبار الباحث “جوناثان روبرتس” أشبه بطلاسم شيطانية صاغها عقلٌ سادي النزعة.

 

– فالمطلوب ليس مجرد فك شفرة كلمات خفية، بل تحديد سؤال مرسوم على هيئة نجمة وسط هذه الفوضى، ثم الإجابة عنه.

 

– هذا ليس لغزًا لتمضية الوقت، بل هو محك حقيقي صُمم خصيصًا ليضع عمالقة الذكاء الاصطناعي، مثل نموذج “أو3- برو” (o3-pro)، في مواجهة تليق بقدراتهم الخارقة.

 

– في خضم التسارع المذهل لعالم الذكاء الاصطناعي، لم تعد المشكلة في ندرة الاختبارات، بل في قدرتها على مواكبة هذا التطور.

 

– فبينما تتسابق الشركات لإطلاق نماذج أذكى وأقوى، يخوض الباحثون سباقًا موازيًا لابتكار مقاييس قادرة على قياس هذا الذكاء بدقة وإنصاف.

 

– وهنا تبرز المعضلة الجوهرية: كيف تضع اختبارًا لعقلٍ يتطور بشكل أسرع من قدرتك على ابتكار الاختبار نفسه؟

 

مقاييس الأمس.. لماذا لم تعد فعّالة؟

 

 

لم تعد معايير التقييم التقليدية قادرة على الصمود، وقد انهارت فعّاليتها لثلاثة أسباب جوهرية:

 

للاطلاع على المزيد من المواضيع والتقارير في صفحة مختارات أرقام

 

1- العيوب المنهجية: جُمع الكثير من الاختبارات القديمة على عجل، فجاءت مليئة بالصياغات الركيكة وأنظمة التصحيح المجحفة. ولعل المثال الأبرز هو اختبار “ImageNet” الشهير للصور، الذي يعاقب النموذج إذا وصف صورة مرآة تعكس موزة بأنها “مرآة”، ويكافئه إذا تجاهل المرآة وحدد “الموز” المنعكس فيها، في مفارقة تكشف سطحية التقييم.

 

2- تلوث البيانات والغش المبرمج: تسربت أسئلة وأجوبة الاختبارات الشائعة إلى محيطات البيانات الهائلة التي تلتهمها النماذج الجديدة. والنتيجة؟ أنظمة ذكاء اصطناعي “تحفظ” الإجابات عن ظهر قلب بدلاً من “فهم” الأسئلة، مما يحول أداءها المذهل في الامتحانات إلى مجرد وهم لا يعكس قدرتها الحقيقية على حل مشكلات العالم الواقعي.

 

3- التشبع والسهولة المفرطة: وصلت النماذج “الحدودية” اليوم إلى مستوى من التطور جعلها تحقق علامات شبه كاملة في الاختبارات القديمة، مما أفقدها قيمتها كأداة للقياس. فعندما يحقق نموذج متطور درجة 99% في اختبار حقق فيه سلفه قبل تسعة أشهر 98.9%، فإن هذا الهامش الضئيل لا يخبرنا شيئًا يُذكر عن القفزة النوعية الهائلة التي حدثت بالفعل.

 

جيل جديد من الألغاز المستحيلة.. أسوار في وجه العقل الآلي

 

لمواجهة هذه التحديات، برز جيل جديد من الاختبارات المصممة لتكون “عصية” على الآلة، ومن أبرزها:

 

– زيرو بينش: وهو التحدي الذي أطلقه روبرتس وفريقه، والمصمم بمعادلة عبقرية: اختبار سهل نسبيًا على الإنسان، ولكنه مستحيل تقريبًا على الذكاء الاصطناعي. حتى هذه اللحظة، لم يتمكن أي نموذج لغوي كبير من تسجيل نقطة واحدة فيه، وكأنه يخبر الآلة: “ما زال أمامك الكثير لتتعلميه”.

 

– انيجما ايفال: مجموعة تضم أكثر من ألف لغز فائق الصعوبة، جمعتها شركة “Scale AI“؛ وهذا الاختبار -على عكس زيرو بينش- ليس سهلًا على أي أحد. تبدأ ألغازه بتعقيدات تفوق الكلمات المتقاطعة غموضًا وتتدرج إلى ما هو أبعد. وعندما وُضعت أقوى النماذج في مواجهته، كانت النتيجة صفرًا مدويًا، باستثناء نموذج واحد من شركة “Anthropic” تمكّن من حل لغز واحد فقط، في إنجاز اعتُبر اختراقًا!

 

ما وراء القوة الخارقة.. محاولة لقياس “الروح” الرقمية

 

 

– لكن القصة لا تنتهي عند حدود القوة الحاسوبية. يمتد السباق اليوم لمحاولة قياس قدرات أكثر عمقًا، مثل المعرفة المتخصصة في طليعة العلوم البشرية، وهو ما يفعله اختبار “الامتحان الأخير للبشرية”، الذي يطرح أسئلة تتراوح بين عدد الأوتار في عظمة طائر طنان، وترجمة نص بالخط التدمري القديم.

 

– ثم ماذا عن ذلك “السحر” غير الملموس الذي تحدث عنه “سام ألتمان”، رئيس “OpenAI“؟ تلك الكيمياء الخاصة التي تجعل تفاعلنا مع نموذج ما يبدو طبيعيًا ومبدعًا بشكل فريد.

 

– هنا تظهر منصات مثل “تشات أرينا” Chatbot Enviornment، التي تترك الحكم للحدس البشري، حيث يسمح للمستخدمين باختيار النموذج الأفضل بناءً على “الإحساس” الشخصي. إنه نهج ينجح في التقاط جزء من هذا السحر الذي تعجز عنه الأرقام الصماء.

 

الذكاء “المراوغ”.. عندما يتعلم الخصم كيف يخدعك

 

 

– تنشأ هنا معضلة أكثر قتامة: هل تكشف هذه الاختبارات عن ذكاء حقيقي أم مجرد براعة في اجتياز الامتحانات؟ يرى باحثون أن التقييم الأمثل هو تتبع أداء النماذج في مهام واقعية، لا في حل ألغاز مصطنعة.

 

– والأمر الأكثر إثارة للقلق هو ظاهرة “الفشل المتعمد” (Sandbagging)، حيث قد تخفق النماذج عمدًا في الاختبارات لإخفاء قدراتها الحقيقية، ربما لتجنب فرض قيود عليها أو حتى حذفها.

 

– أظهر تقرير حديث أن أفضل النماذج باتت قادرة على اكتشاف أنها تخضع للاختبار بنفس كفاءة الباحثين، مما يلقي بظلال من الشك على مصداقية أي تقييم مستقبلي.

 

سباق لا يعرف خط النهاية

 

– على الرغم من كل شيء، فإن قيمة الظهور في صدارة قوائم الأداء تدفع الشركات لمواصلة هذا السباق المحموم؛ فالاختبارات التي بدت مستحيلة بالأمس، تمكنت النماذج من سحقها في غضون أشهر.

 

– إنه سباق تسلح فكري لا نهاية له، لا يهدف فقط إلى تتويج “أذكى” ذكاء اصطناعي، بل يدفعنا كبشر إلى إعادة التفكير في جوهر الذكاء نفسه، وكيفية قياسه، وماذا يعني حقًا أن تكون “ذكيًا” في عالم بدأنا نتقاسمه مع عقولٍ من صنعنا.

 

المصدر: الإيكونيميست

(operate (d, s, id) {
var js, fjs = d.getElementsByTagName(s)[0];
if (d.getElementById(id)) return;
js = d.createElement(s); js.id = id; js.async = true;
js.src = “//join.fb.internet/en-US/sdk.js#xfbml=1#xfbml=1&appId=1581064458982007&model=v2.3”;
fjs.parentNode.insertBefore(js, fjs);
}(doc, ‘script’, ‘facebook-jssdk’));

Like this:

Like Loading...

Related

اختبار الابتكار الاصطناعي الذكاء على قدرة مدى هل يمكن
Share. Facebook Twitter Pinterest LinkedIn Tumblr Email
Admin
  • Website

Related Posts

انفجار كبير يهز العاصمة الأمريكية واشنطن (صورة + فيديو)

June 29, 2025

ترامب يهاجم بعنف المرشح المسلم لمنصب عمدة نيويورك زهران ممداني ويصفه بـ”الشيوعي”

June 29, 2025

من أبعد حبل المشنقة عن الجمالي في العراق؟

June 29, 2025
Leave A Reply Cancel Reply

Don't Miss
NEWS

Jake Paul will get referred to as out after win over Julio Cesar Chavez Jr

By AdminJune 29, 20250

NEWNow you can take heed to Fox Information articles! The previous boxing champion generally known…

Like this:

Like Loading...

How Wiegman’s ‘new England’ have developed forward of Euro 2025

June 29, 2025

Utah Sen. Lee withdraws public land sale provision from GOP tax invoice

June 29, 2025

انفجار كبير يهز العاصمة الأمريكية واشنطن (صورة + فيديو)

June 29, 2025

Alabama lands prime 3 OLB Xavier Griffin for 2026 class

June 29, 2025

OpenAI Management Responds to Meta Provides: ‘Somebody Has Damaged Into Our Dwelling’

June 29, 2025

Republicans, Democrats conflict over Medicaid reforms in Trump laws

June 29, 2025

Coach D. Wayne Lukas, winner of 15 Triple Crown races, dies at 89

June 29, 2025

Jaguars’ Travis Hunter must be put to the take a look at at coaching camp, ex-NFL lineman says

June 29, 2025

ترامب يهاجم بعنف المرشح المسلم لمنصب عمدة نيويورك زهران ممداني ويصفه بـ”الشيوعي”

June 29, 2025
Advertisement
About Us
About Us

NewsTech24 is your premier digital news destination, delivering breaking updates, in-depth analysis, and real-time coverage across sports, technology, global economics, and the Arab world. We pride ourselves on accuracy, speed, and unbiased reporting, keeping you informed 24/7. Whether it’s the latest tech innovations, market trends, sports highlights, or key developments in the Middle East—NewsTech24 bridges the gap between news and insight.

Company
  • Home
  • About Us
  • Contact Us
  • Privacy Policy
  • Disclaimer
  • Terms Of Use
Latest Posts

Jake Paul will get referred to as out after win over Julio Cesar Chavez Jr

June 29, 2025

How Wiegman’s ‘new England’ have developed forward of Euro 2025

June 29, 2025

Utah Sen. Lee withdraws public land sale provision from GOP tax invoice

June 29, 2025

انفجار كبير يهز العاصمة الأمريكية واشنطن (صورة + فيديو)

June 29, 2025

Alabama lands prime 3 OLB Xavier Griffin for 2026 class

June 29, 2025
Newstech24.com
Facebook X (Twitter) Tumblr Threads RSS
  • Home
  • News
  • Arabic News
  • Technology
  • Economy & Business
  • Sports News
© 2025 ThemeSphere. Designed by ThemeSphere.

Type above and press Enter to search. Press Esc to cancel.

%d