Sarvam AI: జెమినీ, చాట్జీపీటీలను వెనక్కినెట్టిన భారత ‘సర్వం ఏఐ’
కృత్రిమ మేధ (Artificial Intelligence) రంగంలో ఇప్పటివరకు అమెరికా, చైనాలదే ఆధిపత్యం. కానీ బెంగళూరుకు చెందిన స్టార్టప్ ‘సర్వం ఏఐ’ (Sarvam AI) ఆ ఆధిపత్యానికి బ్రేకులు వేస్తూ ప్రపంచాన్ని ఆశ్చర్యపరిచింది. భారతీయ భాషలు, డాక్యుమెంట్లను అర్థం చేసుకోవడంలో గూగుల్ జెమినీ (Gemini), ఓపెన్ ఏఐ చాట్జీపీటీ (ChatGPT) వంటి దిగ్గజ మోడళ్లను మించిపోయే పనితీరును ‘సర్వం విజన్’ కనబరిచింది.
సర్వం ఏఐ (Sarvam AI) రూపొందించిన ఓసీఆర్ (Optical Character Recognition) టూల్ ‘సర్వం విజన్’ (Sarvam Vision) అద్భుతమైన ఫలితాలు సాధించింది. సంక్లిష్టమైన డాక్యుమెంట్లు, భారతీయ భాషల్లో ఉన్న టెక్స్ట్ను గుర్తించడంలో ఇది గూగుల్ జెమినీ, చాట్జీపీటీ కంటే మెరుగ్గా పనిచేస్తున్నట్లు కంపెనీ వెల్లడించింది. దీనికోసం నిర్వహించే ఓఎల్ఎంఓసీఆర్-బెంచ్ టెస్టులో (olmOCR-Bench) సర్వం విజన్ ఏకంగా 84.3 శాతం కచ్చితత్వాన్ని (Accuracy) సాధించింది. ఇది గూగుల్ జెమినీ 3 ప్రో, డీప్సీక్ (DeepSeek) వంటి మోడళ్ల కంటే ఎక్కువ కావడం విశేషం.
(adsbygoogle = window.adsbygoogle || []).push({});
రియల్ వరల్డ్ డాక్యుమెంట్లను అర్థం చేసుకునే ఆమ్నిడాక్బెంచ్ (OmniDocBench v1.5)టెస్టులో కూడా సర్వం విజన్ (Sarvam AI) 93.28 శాతం స్కోరు సాధించింది. ముఖ్యంగా గణిత సూత్రాలు, టేబుల్స్ వంటి క్లిష్టమైన ఫార్మాట్లను ఇది సులభంగా అర్థం చేసుకుంటోంది. కేవలం టెక్స్ట్ మాత్రమే కాకుండా, వాయిస్ జనరేషన్లోనూ సర్వం ఏఐ (Sarvam AI) తన సత్తా చాటుతోంది. ‘బుల్ బుల్ వి3’ (Bulbul V3) పేరుతో టెక్స్ట్-టు-స్పీచ్ (Text-to-Speech) మోడల్ను విడుదల చేసింది. ఇది 11 భారతీయ భాషల్లో 35 రకాల వాయిస్లతో అత్యంత సహజంగా (Natural) ఆడియోను జనరేట్ చేయగలదు. ఎలెవెన్ ల్యాబ్స్ (ElevenLabs) వంటి అంతర్జాతీయ సంస్థల టూల్స్ కంటే ఇది భారతీయ భాషలకు మెరుగ్గా, తక్కువ ఖర్చుతో అందిస్తోందని యూజర్లు కొనియాడుతున్నారు.













