سرخط خبرها
  • معاون وزیر صمت: برق صنایع تولیدی نباید قطع شود
  • اصفهان قهرمان پارادو میدانی بانوان ایران شد
  • ارزیابی خودروهای آسیب‌دیده در جنگ شتاب گرفت، ۷۲درصد خسارت ها پرداخت شد
  • پرشدگی ۶۵ درصدی سدهای کشور
  • ۴۴.۵۷ میلیارد مترمکعب آب وارد مخازن شد
  • مرگ تلخ یک کوهنورد در ارتفاعات
  • انفجار خط لوله گاز در تبریز
  • پزشکیان: اگر رهبری دستور می‌دادند مذاکره نشود قطعاً اطاعت می‌کردیم
  • دومینوی استعفا در جام‌جهانی ادامه دارد
  • موکب‌های نجف تا کربلا در آپارتمان‌های تهران
  • تأمین اجتماعی: تماس‌های تلفنی مشکوک کلاهبرداری است
  • بازرسی ویژه از پمپ‌بنزین‌ها
  • استقرار بیمارستان ۲۰۰ تختخوابی برای خدمت‌رسانی به زائران در مصلا
  • موضعگیری جدید ترامپ علیه چین
  • تفاهم نامه همکاری بین بنیاد شهید رییسی و دانشگاه امام حسین
  • اوسمار از پرسپولیس جدا شد
  • |قالیباف: دسترسی بازرسان آژانس به سایت‌های بمباران شده کذب است
  • ۶ هزار آتش‌نشان در آماده‌باش، ۱۲۰۰ نیرو در محل مراسم تشییع رهبر شهید مستقر می‌شوند
  • موزه‌ها و اماکن تاریخی ۱۵ تیر تعطیل است
  • ۲۱ ماه حبس برای شکارچیان خرس سبلان

نشست تخصصی معرفی مدل‌های زبانی همراه اول برگزار شد

نشست تخصصی معرفی و ارائه تعدادی از مدل‌های زبانی توسعه یافته توسط گروه MCINext که سیستم‌های مرتبط هوش مصنوعی، در نمایشگاه الکامپ ۱۴۰۳ برگزار شد.

همراه اول
به گزارش خبرگزاری موج

، گروه MCINext همراه اول در سومین روز برگزاری نمایشگاه بین المللی الکامپ ۱۴۰۳، ضمن رونمایی تعدادی از مدل های زبانی توسعه یافته خود شامل سیلک (با ۱.۳میلیارد پارامتر)، آهوران (با ۸ میلیارد پارامتر) و آوا (با ۱۳ میلیارد پارامتر) را با حضور آرش امینی، سرپرست تحقیق و توسعه هوش مصنوعی MCINEXT و حامد تهمورسی، مدیر ارشد فناوری MCINEXT در سالن خلیج فارس نمایشگاه بین المللی تهران، در نشستی تخصصی کارکردها و ویژگی های هر یک از آنها را ارائه کرد.

در این نشست، علاوه بر تاکید روی توسعه محصولات مبتنی بر هوش مصنوعی، دستاوردهای این مجموعه از جمله ربات پاسخگو همراه اول و چند مدل زبانی که برای استفاده همگانی در دسترس قرار گرفته اند نیز معرفی شدند.

مدل های زبانی بزرگ (LLM)، سیستم های هوش مصنوعی هستند که با تحلیل و یادگیری از حجم زیادی از داده های متنی، قادر به تولید متن، ترجمه، پاسخ به سوالات و انجام وظایف مختلف زبانی هستند و در حال حاضر نیز با حمایت مرکز تحقیق و توسعه همراه اول توسعه یافته اند.

در ادامه به صورت اجمالی هر یک از مدل های زبانی بزرگ گروه MCINEXT همراه اول معرفی و ارائه شدند.
 
*مدل زبانی سیلک (Sialk)

مدل زبانی سیلک که از پایه (from scratch) با مجموعه دادگان فارسی در این شرکت آموزش داده شده است، با وجود تعداد پارامتر نسبتا کم، قابلیت زبانی خوبی را به نمایش می گذارد که با ادامه فرآیند آموزش در آینده، از لحاظ دانش نیز بهتر خواهد شد.
 
*مدل زبانی آهوران (Ahoran)

مدل آهوران بر پایه مدل چند زبانه Llama3 شرکت Meta و به صورت آموزش ادامه دار (continual pretraining)   بر روی یک مجموعه دادگان فارسی توسعه داده شده است. با توجه به قابلیت های زیاد مدل پایه، ادامه آموزش، باعث تقویت تولید متن به زبان فارسی شده در حالیکه قابلیت های دیگر مدل تا حد زیادی حفظ شده است.
 
کاربردهای تجاری این مدل ها بسیار گسترده و نظیر تولید محتوای متنی خودکار، پشتیبانی مشتریان از طریق چت بات ها، تحلیل احساسات و نظرات کاربران در شبکه های اجتماعی و ایجاد ابزارهای کمکی برای نویسندگان و مترجمان است. این مدل ها می توانند به شرکت ها در افزایش بهره وری، کاهش هزینه ها و بهبود تجربه مشتری کمک کنند.
 
*مدل زبانی آوا (Ava)

مدل آوا به منظور پاسخگویی از داخل یک متن داده شده (context) و بر پایه مدل aya از شرکت cohere  توسعه داده شده است.
 
بر خلاف دو مدل قبلی که جوابگوی سوالات کلی هستند، این مدل نیازمند ارائه اطلاعات اولیه برای پاسخگویی است (RAG) و تا حد امکان از ارائه اطلاعات استفاده شده در حین آموزش پرهیز می کند؛ استفاده اصلی این مدل در ربات های پاسخگوی خاص منظوره است.

علاوه بر آموزش این مدل ها، تلاش شده است تا به کمک روش های همترازسازی (RLHF و DPO) از تولید محتوای آسیب زا جلوگیری شود.

دیدگاه های ارسال شده توسط شما، پس از تایید توسط خبرگزاری موج در وب منتشر خواهد شد.

پیام هایی که حاوی تهمت و افترا باشد منتشر نخواهد شد.

پیام هایی که به غیر از زبان فارسی یا غیرمرتبط باشد منتشر نخواهد شد.

ارسال نظر

مهمترین اخبار

گفتگو

آخرین اخبار گروه

پربازدیدترین گروه