في خطوة جديدة تؤكد اشتعال المنافسة في عالم الذكاء الاصطناعي، أعلنت Microsoft عن إطلاق مجموعة من النماذج المتطورة التي تستهدف مجالات حيوية مثل تحويل الصوت إلى نص، وتوليد الصوت، وإنشاء الصور ، هذه النماذج لا تأتي فقط بقدرات قوية، بل تدّعي الشركة أنها تتفوق على حلول منافسين كبار في السوق.
ماذا قدمت مايكروسوفت؟
كشفت مايكروسوفت عن ثلاثة نماذج رئيسية:
MAI-Transcribe-1: لتحويل الكلام إلى نص بدقة عالية ويدعم أكثر من 25 لغة.
MAI-Voice-1: لتوليد صوت واقعي بتعبيرات
عاطفية متقدمة .
MAI-Image-2: لإنشاء صور بجودة محسّنة
وتفاصيل دقيقة.
أهم نقاط القوة الأساسية
سرعة فائقة: توليد الصوت قد يصل إلى 60 ثانية في ثانية واحدة فقط.
تكلفة تنافسية: تستهدف جذب المطورين والشركات بأسعار أقل.
دعم متعدد اللغات: خاصة في نموذج تحويل الصوت إلى نص.
جودة بصرية عالية: تحسين الإضاءة والتفاصيل في الصور.
والنماذج الجديدة متاحة عبر منصات مايكروسوفت مثل:
Microsoft Foundry
Copilot
Bing
PowerPoint
وهذا يعني أنها ستدخل مباشرة في أدوات يستخدمها الملايين يوميًا.
هل تتفوق فعلاً على المنافسين؟
تدّعي مايكروسوفت أن نموذج Transcribe-1 يتفوق على نماذج من Google وOpenAI من حيث دقة تحويل الصوت إلى نص، استنادًا إلى اختبارات داخلية ، لكن الحكم النهائي سيظل بيد المستخدمين والتجارب الواقعية.
ما تفعله مايكروسوفت الآن ليس مجرد تحديث، بل خطوة استراتيجية لتوسيع سيطرتها في سوق الذكاء الاصطناعي ، ومع تسارع المنافسة يبدو أننا على أعتاب مرحلة جديدة من أدوات أكثر ذكاءً وسرعة وتأثيرًا في حياتنا اليومية.
















0 تعليق