ఓపెనాయ్ ఇటీవల ప్రారంభించిన O3 మరియు O4-MINI AI మోడల్స్ భ్రాంతులు, సంస్థ యొక్క మునుపటి రీజనింగ్ మోడళ్ల కంటే చాలా తరచుగా, ఒక నివేదిక టెక్ క్రంచ్ పేర్కొన్నారు. చాట్గ్ప్ట్ సృష్టికర్తలు బుధవారం (ఏప్రిల్ 16) మోడళ్లను ప్రారంభించారు, ఇవి ప్రతిస్పందించే ముందు ప్రశ్నల ద్వారా పాజ్ చేయడానికి మరియు పని చేయడానికి రూపొందించబడ్డాయి.
ఏదేమైనా, ఓపెనాయ్ యొక్క అంతర్గత పరీక్షల ప్రకారం, రెండు కొత్త నమూనాలు GPT-4O వంటి రీజనింగ్ కాని నమూనాల కంటే చాలా తరచుగా భ్రమలు లేదా చాలా తరచుగా తయారుచేస్తున్నాయి. ఇది ఎందుకు జరుగుతుందో కంపెనీకి తెలియదు.
సాంకేతిక నివేదికలో, ఓపెనై మాట్లాడుతూ, భ్రాంతులు ఎందుకు తీవ్రమవుతున్నాయో అర్థం చేసుకోవడానికి “మరింత పరిశోధన అవసరం” అని చెప్పింది, ఎందుకంటే ఇది తార్కిక నమూనాలను పెంచుతుంది.
“మా పరికల్పన ఏమిటంటే, ఓ-సిరీస్ మోడళ్ల కోసం ఉపయోగించే ఉపబల అభ్యాసం సాధారణంగా ప్రామాణిక పోస్ట్-ట్రైనింగ్ పైప్లైన్ల ద్వారా తగ్గించే (కాని పూర్తిగా తొలగించబడదు) సమస్యలను విస్తరించవచ్చు” అని మాజీ ఓపెనాయ్ ఉద్యోగి ప్రచురణ ద్వారా పేర్కొన్నారు.
మోడల్స్ సృజనాత్మక మరియు ఆసక్తికరమైన ఆలోచనలను అభివృద్ధి చేయడంలో భ్రాంతులు సహాయపడతాయని నిపుణులు పేర్కొన్నారు, అవి మార్కెట్లో వ్యాపారాలకు కఠినమైన అమ్మకంగా మారవచ్చు, ఇక్కడ ఖచ్చితత్వం సాధించడానికి పారామౌంట్ బెంచ్ మార్క్.
కట్త్రోట్ గ్లోబల్ AI రేసులో గూగుల్, మెటా, XAI, ఆంత్రోపిక్ మరియు డీప్సీక్ వంటి వారిని ఓడించటానికి ఓపెనాయ్ కొత్త మోడళ్లపై భారీగా బెట్టింగ్ చేస్తోంది. సామ్ ఆల్ట్మాన్ నేతృత్వంలోని సంస్థ ప్రకారం, O3 స్వీ-బెంచ్ ధృవీకరించబడిన దానిపై అత్యాధునిక పనితీరును సాధిస్తుంది-కోడింగ్ సామర్ధ్యాలను కొలిచే పరీక్ష, 69.1 శాతం స్కోరు చేసింది. ఇంతలో, O4-MINI మోడల్ ఇలాంటి పనితీరును సాధిస్తుంది, 68.1 శాతం సాధించింది.
చాట్గ్ప్ట్ ప్రజలను ఒంటరిగా చేస్తుంది
ఈ నెల ప్రారంభంలో, ఓపెనాయ్ మరియు MIT మీడియా ల్యాబ్ నిర్వహించిన ఉమ్మడి అధ్యయనం ప్రకారం, చాట్గ్ప్ట్ తన చాలా తరచుగా వినియోగదారులను మరింత ఒంటరిగా చేస్తుంది. ఒంటరితనం మరియు సామాజిక ఒంటరితనం యొక్క భావాలు తరచూ వివిధ కారకాలచే ప్రభావితమవుతున్నప్పటికీ, అధ్యయన రచయితలు చాట్గ్ట్తో విశ్వసించిన మరియు “బంధం” ఉన్న పాల్గొనేవారు ఇతరులకన్నా ఒంటరిగా ఉండటానికి మరియు దానిపై ఎక్కువ ఆధారపడటానికి ఇష్టపడతారని తేల్చారు.
సాంకేతికత ఇంకా ప్రారంభ దశలో ఉన్నప్పటికీ, వినియోగదారుల మానసిక ఆరోగ్యంపై దాని పూర్తి ప్రభావం గురించి సంభాషణను ప్రారంభించడానికి ఈ అధ్యయనం సహాయపడవచ్చని పరిశోధకులు చెప్పారు.