Google ने मेडिकल इमेजिंग और भाषण के लिए एआई मॉडल तक पहुंच खोली, मेडजेम्मा 1.5 और मेडएएसआर का अनावरण किया: वह सब जो आपको जानना आवश्यक है

Google ने मेडिकल इमेजिंग और भाषण के लिए एआई मॉडल तक पहुंच खोली, मेडजेम्मा 1.5 और मेडएएसआर का अनावरण किया: वह सब जो आपको जानना आवश्यक है

Google ने मेडिकल एआई में अपने विस्तार प्रयासों के तहत स्वास्थ्य देखभाल पर केंद्रित दो नए कृत्रिम बुद्धिमत्ता मॉडल, मेडजेम्मा 1.5 और मेडएएसआर लॉन्च किए हैं। कुछ प्रतिद्वंद्वियों के विपरीत, जो मुख्य रूप से सशुल्क एंटरप्राइज़ सेवाओं के रूप में हेल्थकेयर एआई उपकरण प्रदान करते हैं, Google ने व्यापक अनुसंधान और डेवलपर समुदाय के लिए दोनों मॉडलों को सार्वजनिक रूप से जारी करके अधिक खुले दृष्टिकोण का विकल्प चुना है।

मेडजेम्मा 1.5 चिकित्सा छवियों और पाठ को लक्षित करता है

मेडजेम्मा 1.5 यह Google के मेडिकल विज़न-लैंग्वेज मॉडल का नवीनतम संस्करण है, जिसे लिखित जानकारी के साथ-साथ मेडिकल छवियों का विश्लेषण करने के लिए बनाया गया है। मॉडल स्कैन की व्याख्या कर सकता है, दृश्य चिकित्सा डेटा से संबंधित प्रश्नों का उत्तर दे सकता है, और अनुसंधान-उन्मुख कार्यों की एक श्रृंखला में सहायता कर सकता है।

Google रिसर्च के अनुसार, अद्यतन संस्करण जटिल चिकित्सा इमेजरी से निपटने के दौरान बेहतर मल्टीमॉडल तर्क और बेहतर प्रदर्शन लाता है। इसे अधिक लचीला बनाने के लिए भी डिज़ाइन किया गया है, जिससे शोधकर्ताओं को विशेष डेटासेट और विशिष्ट अध्ययन आवश्यकताओं के लिए इसे ठीक करने की अनुमति मिलती है।

यह मॉडल मेडिकल इमेजिंग के कई रूपों का समर्थन करता है, जिसमें रेडियोलॉजी स्कैन और अन्य नैदानिक ​​​​रूप से प्रासंगिक दृश्य शामिल हैं। Google ने कहा कि MedGemma 1.5 छवि-आधारित प्रश्न उत्तर, रिपोर्ट प्रारूपण और संरचित डेटा निष्कर्षण जैसे उपयोगों के लिए है। कंपनी ने जोर देकर कहा कि इसका उद्देश्य निदान या उपचार सलाह प्रदान करना नहीं है और इसे केवल अनुसंधान और विकास सेटिंग्स में एक सहायता उपकरण के रूप में उपयोग किया जाना चाहिए।

मेडएएसआर क्लिनिकल स्पीच रिकग्निशन पर केंद्रित है

साथ में मेडजेम्मा 1.5, Google ने MedASR पेश किया, जो एक स्वचालित वाक् पहचान मॉडल है जो विशेष रूप से स्वास्थ्य देखभाल वातावरण के लिए डिज़ाइन किया गया है। मेडएएसआर को मेडिकल शब्दावली, विविध उच्चारण और वास्तविक दुनिया के क्लिनिकल ऑडियो की चुनौतियों पर विशेष ध्यान देते हुए बोली जाने वाली नैदानिक ​​बातचीत को पाठ में बदलने के लिए बनाया गया है।

Google ने कहा कि मॉडल का लक्ष्य ट्रांसक्रिप्शन त्रुटियों को कम करना है जो अक्सर तब होती हैं जब सामान्य प्रयोजन वाक् पहचान प्रणाली का उपयोग चिकित्सा संदर्भों में किया जाता है। संभावित उपयोग के मामलों में डॉक्टर-रोगी चर्चाओं को प्रतिलेखित करना, नैदानिक ​​नोट्स बनाना और निर्धारित रिपोर्टों को पाठ में परिवर्तित करना शामिल है।

कंपनी ने इसे जोड़ा मेडएएसआर विभिन्न स्वास्थ्य देखभाल सेटिंग्स के लिए अनुकूलित किया जा सकता है और विशिष्ट नैदानिक ​​​​वर्कफ़्लो या दस्तावेज़ीकरण मानकों से मेल खाने के लिए इसे ठीक किया जा सकता है।

डेवलपर्स और शोधकर्ताओं के लिए खुली पहुंच

गूगल ने कहा कि मेडजेम्मा और मेडएएसआर के सभी संस्करण हगिंग फेस और वर्टेक्स एआई प्लेटफॉर्म के माध्यम से उपलब्ध हैं। डेवलपर्स मेडजेम्मा गिटहब रिपॉजिटरी के माध्यम से दस्तावेज़ीकरण और ट्यूटोरियल तक भी पहुंच सकते हैं।