Visual Capitalist-მა, Tracking AI-ის მიერ შეგროვებულ მონაცემებზე დაყრდნობით, ხელოვნური ინტელექტის ყველაზე ჭკვიანი მოდელების სია შემოგვთავაზა. AI-მოდელების შესაფასებლად კი Mensa Norway IQ-ის ტესტი გამოიყენეს. აღსანიშნავია, რომ ის ადამიანის ინტელექტის შესაფასებლად შექმნილ ერთ-ერთ ყველაზე რთულ IQ-ტესტად არის მიჩნეული.
ცნობისთვის, შესადარებლად გეტყვით, რომ ადამიანის საშუალო IQ-ქულა 90-დან 110-მდე მერყეობს, ხოლო 130-ზე მაღალი ქულა, როგორც წესი, გენიოსის დონედ მიიჩნევა.
Visual Capitalist-ის მიერ შემოთავაზებული სიის სათავეში OpenAI-ის ტექსტური o3 მოდელია. მან Mensa IQ-ს ტესტში 135 ქულა მიიღო, რაც მოდელს ადგილს „გენიოსების“ კატეგორიაში ანიჭებს. როგორც ChatGPT-ის შემადგენელი ნაწილი, ის ასევე მსოფლიოში ხელოვნური ინტელექტის ყველაზე პოპულარულ ინსტრუმენტებს შორისაა.
Anthropic-ის Claude-4 Sonnet-ი და Google-ის Gemini 2.0 Flash Thinking-ი, შესაბამისად, 127 და 126 IQ-ქულით, მორე და მესამე პოზიციაზეა. გარდა ამისა, ახალმა მოდელებმა, როგორიცაა Gemini 2.5 Pro და OpenAI o4 mini, ორივემ 120-ზე მეტი ქულა დააგროვა, რაც ადამიანის IQ-ის საშუალო დიაპაზონზე მაღალია.
ამგვარი ქულების მიღება ადასტურებს, რომ AI-ის წამყვანი მოდელები ამჟამად ინტელექტის მაღალ დონეზე მუშაობს, ზოგიერთი მათგანი კი ყველაზე ჭკვიანი ადამიანის გონებასაც კი აღემატება.
თუმცა, გასაკვირი ის არის, რომ 10 ყველაზე ჭკვიანი AI-მოდელიდან ყველა მხოლოდ ტექსტური მოდელია, რომელსაც სურათების წაკითხვა ან დამუშავება არ შეუძლია. IQ-ქულების მიხედვით, როგორც ჩანს, სიტყვებით მსჯელობა ხელოვნური ინტელექტისთვის გაცილებით ძლიერი მხარეა, ვიდრე სურათებისა და ვიზუალური თავსატეხების ინტერპრეტაცია და ამოხსნა.
10 ყველაზე ჭკვიანი AI-მოდელი
მოდელის სახელი | Mensa Norway IQ ტესტის ქულა |
---|---|
OpenAI o3 | 135 |
Claude-4 Sonnet | 127 |
Gemini 2.0 Flash Thinking Exp. | 126 |
Gemini 2.5 Pro Exp. | 124 |
OpenAI o4 mini | 122 |
Claude-4 Opus | 120 |
Grok-3 Think | 112 |
DeepSeek R1 | 106 |
Llama 4 Maverick | 105 |
OpenAI o1 Pro | 102 |