ووصفت OpenAI نموذج o1 بأنه "تقدم كبير" و"مستوى جديد من قدرات الذكاء الاصطناعي"، وقالت إن النموذج قد دُرّب باستخدام آلية "التعلم المعزز" لاتباع عملية تفكير داخلية قبل تقديم الإجابات.
وأوضح نوام براون، المشارك في تطوير النموذج داخل الشركة، قائلًا: "دُرّب o1 باستخدام التعلم المعزز ليفكّر قبل الاستجابة عبر سلسلة خاصة من الأفكار، وكلما استغرق وقتًا أطول في التفكير، كان أداؤه أفضل في المهام التي تتطلب التفكير المنطقي".
ويتوافق النموذج الجديد مع التوقعات السابقة بشأن مشروع "ستروبيري Strawberry" الذي تحدثت عنه الكثير من التقارير الصحفية.
وأشار براون إلى أن نماذج o1 لا تتفوق دائمًا على سابقتها GPT-4o في كافة المجالات؛ لأن العديد من المهام لا تحتاج إلى التفكير، وفي بعض الأحيان، لا يستحق الأمر الانتظار للحصول على إجابة بطيئة من o1 مقابل إجابة سريعة فورية من GPT-4o، على حد تعبيره.
وأصدرت OpenAI نسخة مصغرة من النموذج تحت اسم o1-preview لتحديد حالات الاستخدامات الأكثر ملاءمة، وتحديد المجالات التي تحتاج إلى تحسين، وقد أكدّت الشركة أن النموذج الجديد قد يخفق في بعض المهام البسيطة؛ لكنه يقدّم أداءً مذهلًا في المهام المنطقية.
وفي الوقت الحالي، يقضي o1 بضع ثوانٍ فقط قبل تقديم الإجابة، ولكن في المستقبل، تأمل OpenAI أن يتمكن النموذج من التفكير لساعات أو حتى أيام قبل الإجابة، وفي حين يزيد هذا تكلفة الحوسبة، لكنه قد يكون مُبررًا في بعض الاستخدامات مثل تطوير الأدوية الجديدة.
وإلى جانب o1-preview، قدّمت OpenAI أيضًا نسخة o1-mini، وهي نسخة أقل تكلفة ومخصصة لتطبيقات العلوم والتكنولوجيا والهندسة والرياضيات، وقد حقق نموذج o1-mini أداءً مشابهًا لنموذج o1 في مهام الرياضيات والبرمجة، ولكن بتكلفة أقل كثيرًا.
ويمكن لمستخدمي ChatGPT Plus و Team الوصول إلى نماذج o1-preview و o1-mini الآن، في حين سيحصل المستخدمون في قطاع المؤسسات والتعليم على هذه النماذج بحلول الأسبوع المقبل.