flag

هوش مصنوعی و علوم داده

هوش مصنوعی، هوشی است که توسط ماشین‌ها ظهور پیدا می‌کند، در مقابل هوش طبیعی که توسط انسان و سایر موجودات پدید می آید. به عبارت بهتر، یک سامانه هوشمند سامانه‌ای است که محیط خود را درک کرده و کنش‌هایی را انجام می‌دهد که شانسش را در دستیابی به اهدافش بیشینه می‌سازد. در این سامانه ها روش تحلیل مانند یادگیری و حل مسئله، عموما از روی ذهن انسان‌ها تقلید می‌شوند. علوم داده روشی برای تحلیل داده‌ها است که مدل‌های تحلیلی را به‌صورت خودکار ایجاد می‌کند. این علم، شاخه‌ای از هوش مصنوعی است که به کمک آن سامانه‌ها می‌توانند با حداقل دخالت انسان از داده‌ها بیاموزند، الگوها را شناسایی کنند و بر اساس آن تصمیم بگیرند.

توانمندی های واحد فناوری‌های نوین شرکت مگفا در حوزه هوش مصنوعی

داده کاوی

داده‌کاوی به استخراج اطلاعات نهان یا الگوها و روابط مشخص در حجم زیادی از داده‌ها در یک یا چند منبع داده گفته می‌شود. اهداف زیادی برای استخراج اطلاعات، الگوها و یا دانش وجود دارد که بستگی به مسئله مطرح شده دارد. برخی از زیر شاخه‌های داده‌کاوی که مگفا به آن پرداخته است: دسته‌بندی داده‌ها، خوشه‌بندی و استخراج الگوهای مکرر می‌باشد.

پردازش متن و زبان طبیعی

به کلیه پردازش های هوشمند که منجر به استنباط و فهم ماشین از متون می شود، پردازش زبان طبیعی گفته می شود. به عبارت دقیق‌تر هدف از این حوزه، درک ماشین از مفاهیم بیان‌شده توسط زبان طبیعیِ انسان در قالب متن است. مواردی مانند دسته‌بندی متون، استخراج کلیدواژه، خلاصه‌سازی متن، شباهت‌یابی متون و تحلیل نظرات کاربران برخی از کاربردهایی است که بسته به نیاز مشتریان به آن ورود کرده‌ایم.

پردازش تصویر و سیگنال

تحلیل هوشمند محتوای تصاویر با کمک هوش مصنوعی در سال های اخیر پیشرفت چشمگیری داشته است. کاربرد این حوزه بسیار متنوع است که از جمله مهمترین آنها می­توان به اتوماسیون صنعتی، حمل و نقل، تشخیص اشیا، احراز هویت و تصاویر پزشکی اشاره نمود. و به طور کلی هر کاربردی که با پردازش تصویر و ویدیو و ردیابی اشیاء مرتبط باشد در این دسته قرار می­گیرد.

خدمات و راهکارها

محصولات

سامانه تحلیل هوشمند متن (تهمتن)

تهمتن مجموعه­ای از وب­سرویس‌های هوشمند پردازش متن است در واحد هوش مصنوعی شرکت مگفا توسعه پیدا کرده است. برخی از سرویس های آن عبارتند از:

   استخراج کلیدواژه

– خلاصه­ سازی استخراجی

– تولید خودکار عنوان

مشتریان این محصول، سازمان­هایی مانند کتابخانه و اسناد ملی ایران، وزارتخانه­ها، مراکز دانشگاهی و حوزوی و در یک جمله، کلیه نهادهای تحقیقاتی هستند که به نوعی با اسناد و محتوا سروکار دارند.

استخراج کلیدواژه

استخراج کلیدواژه: این وب سرویس به صورت خودکار و هوشمند کلیدواژه های اصلی یک متن را استخراج می کند و به ترتیب اولویت (که با یک امتیاز مشخص می شود) به کاربر نمایش می دهد. در شکل زیر نمایی از خروجی این وب سرویس نمایش داده شده است.

خلاصه سازی استخراجی

این وب سرویس بصورت خودکار یک خلاصه از متن استخراج می کند، به این صورت که مهم ترین جملات متن را شناسایی کرده و کنار هم قرار می دهد. این امکان وجود دارد که کاربر تعداد جملات یا درصد خلاصه سازی مورد نظر خود را تعیین کند. برای شناسایی جملات مهم، از تکنیک های تعیین شباهت جملات و الگوهای نوشتاری خاص استفاده شده است. نمونه ای از خروجی این سرویس در شکل زیر مشاهده می شود

تولید خودکار عنوان

این وب سرویس یک متن را از ورودی گرفته و برای آن یک عنوان بامعنی تولید می کند. ویژگی جالب عنوان تولید شده، آن است که چکیده ای از متن بوده و ساختار نوشتاری آن می تواند بکلی متفاوت از متن اصلی باشد. با توجه به اینکه فرایند تولید عنوان به کمک فناوری پیچیده یادگیری عمیق انجام می گیرد، طول تولید عنوان تولید شده، ساختار و حتی محتوای آن، تا حدود زیادی وابسته به حوزه تخصصی دادگانی است که استفاده می شود. شکل بالا نمونه خروجی این سرویس را نمایش می دهد