Wednesday, June 25, 2025
HomeBlogఓపెనాయ్ యొక్క రీజనింగ్ మోడల్స్ "భ్రమలు" మరియు సృష్టికర్తలకు ఎందుకు తెలియదు: రిపోర్ట్

ఓపెనాయ్ యొక్క రీజనింగ్ మోడల్స్ “భ్రమలు” మరియు సృష్టికర్తలకు ఎందుకు తెలియదు: రిపోర్ట్

ఓపెనాయ్ ఇటీవల ప్రారంభించిన O3 మరియు O4-MINI AI మోడల్స్ భ్రాంతులు, సంస్థ యొక్క మునుపటి రీజనింగ్ మోడళ్ల కంటే చాలా తరచుగా, ఒక నివేదిక టెక్ క్రంచ్ పేర్కొన్నారు. చాట్‌గ్ప్ట్ సృష్టికర్తలు బుధవారం (ఏప్రిల్ 16) మోడళ్లను ప్రారంభించారు, ఇవి ప్రతిస్పందించే ముందు ప్రశ్నల ద్వారా పాజ్ చేయడానికి మరియు పని చేయడానికి రూపొందించబడ్డాయి.

ఏదేమైనా, ఓపెనాయ్ యొక్క అంతర్గత పరీక్షల ప్రకారం, రెండు కొత్త నమూనాలు GPT-4O వంటి రీజనింగ్ కాని నమూనాల కంటే చాలా తరచుగా భ్రమలు లేదా చాలా తరచుగా తయారుచేస్తున్నాయి. ఇది ఎందుకు జరుగుతుందో కంపెనీకి తెలియదు.

సాంకేతిక నివేదికలో, ఓపెనై మాట్లాడుతూ, భ్రాంతులు ఎందుకు తీవ్రమవుతున్నాయో అర్థం చేసుకోవడానికి “మరింత పరిశోధన అవసరం” అని చెప్పింది, ఎందుకంటే ఇది తార్కిక నమూనాలను పెంచుతుంది.

“మా పరికల్పన ఏమిటంటే, ఓ-సిరీస్ మోడళ్ల కోసం ఉపయోగించే ఉపబల అభ్యాసం సాధారణంగా ప్రామాణిక పోస్ట్-ట్రైనింగ్ పైప్‌లైన్ల ద్వారా తగ్గించే (కాని పూర్తిగా తొలగించబడదు) సమస్యలను విస్తరించవచ్చు” అని మాజీ ఓపెనాయ్ ఉద్యోగి ప్రచురణ ద్వారా పేర్కొన్నారు.

మోడల్స్ సృజనాత్మక మరియు ఆసక్తికరమైన ఆలోచనలను అభివృద్ధి చేయడంలో భ్రాంతులు సహాయపడతాయని నిపుణులు పేర్కొన్నారు, అవి మార్కెట్లో వ్యాపారాలకు కఠినమైన అమ్మకంగా మారవచ్చు, ఇక్కడ ఖచ్చితత్వం సాధించడానికి పారామౌంట్ బెంచ్ మార్క్.

కట్‌త్రోట్ గ్లోబల్ AI రేసులో గూగుల్, మెటా, XAI, ఆంత్రోపిక్ మరియు డీప్‌సీక్ వంటి వారిని ఓడించటానికి ఓపెనాయ్ కొత్త మోడళ్లపై భారీగా బెట్టింగ్ చేస్తోంది. సామ్ ఆల్ట్మాన్ నేతృత్వంలోని సంస్థ ప్రకారం, O3 స్వీ-బెంచ్ ధృవీకరించబడిన దానిపై అత్యాధునిక పనితీరును సాధిస్తుంది-కోడింగ్ సామర్ధ్యాలను కొలిచే పరీక్ష, 69.1 శాతం స్కోరు చేసింది. ఇంతలో, O4-MINI మోడల్ ఇలాంటి పనితీరును సాధిస్తుంది, 68.1 శాతం సాధించింది.

కూడా చదవండి | మేము స్థలం మరియు సమయాన్ని మార్చగలమా? వైట్ హౌస్ టెక్ చీఫ్ యొక్క ప్రసంగం కుట్ర సిద్ధాంతాలను ప్రేరేపిస్తుంది

చాట్‌గ్ప్ట్ ప్రజలను ఒంటరిగా చేస్తుంది

ఈ నెల ప్రారంభంలో, ఓపెనాయ్ మరియు MIT మీడియా ల్యాబ్ నిర్వహించిన ఉమ్మడి అధ్యయనం ప్రకారం, చాట్‌గ్ప్ట్ తన చాలా తరచుగా వినియోగదారులను మరింత ఒంటరిగా చేస్తుంది. ఒంటరితనం మరియు సామాజిక ఒంటరితనం యొక్క భావాలు తరచూ వివిధ కారకాలచే ప్రభావితమవుతున్నప్పటికీ, అధ్యయన రచయితలు చాట్‌గ్ట్‌తో విశ్వసించిన మరియు “బంధం” ఉన్న పాల్గొనేవారు ఇతరులకన్నా ఒంటరిగా ఉండటానికి మరియు దానిపై ఎక్కువ ఆధారపడటానికి ఇష్టపడతారని తేల్చారు.

సాంకేతికత ఇంకా ప్రారంభ దశలో ఉన్నప్పటికీ, వినియోగదారుల మానసిక ఆరోగ్యంపై దాని పూర్తి ప్రభావం గురించి సంభాషణను ప్రారంభించడానికి ఈ అధ్యయనం సహాయపడవచ్చని పరిశోధకులు చెప్పారు.




Source link

RELATED ARTICLES

LEAVE A REPLY

Please enter your comment!
Please enter your name here

- Advertisment -

Most Popular

Recent Comments