گپ با هوشمصنوعی به لهجههای شیرین فارسی
داستان استارتاپ ایرانی ساکن « استیشن اف» که یک دستیار صوتی مشابه «الکسا» و «سیری» ساخته است، با این تفاوت که زبان فارسی و حتی لهجههای مختلف را میفهمد و به حرفهای کاربر جواب میدهد
اشکان خسروپور/خبرنگار
از بچگی عاشق کارهای عجیب و غریب بود؛ عاشق ساختن روبات و بعدتر برنامهنویسی، اما دستآخر زبانشناس و در نهایت زبانشناس کامپیوتری شد. سرنوشت، بازی بامزهای را با سمیه باقربیگی شروع کرده بود. او را یک دور، بین تمام چیزهایی که دوست داشت، گرداند و بعد تمام آنچه در این سالها آموخته بود، از زبانشناسی گرفته تا برنامهنویسی و... به کارش آمد تا بتواند آن را در یکی از پروژههای خاص در حوزه هوش مصنوعی ایران بهکار بگیرد؛ پروژهای که زندگی او را از نظر حرفهای و البته شخصی کاملا تغییر داد. سمیه باقربیگی و همسرش اکنون استارتاپ «هایبرینی» را که سالها در ایران فعال بود، به فرانسه بردهاند تا در استیشن اف، بزرگترین مجتمع استارتاپی جهان در مقیاس جهانی، کارشان را پیش ببرند. این داستان زندگی سمیه باقربیگی و استارتاپ خاصی است که محصولاتی در حوزه پردازش متن، گفتار و تصویر ارائه میکند. جالبترین آنها که توجه زیادی را در دنیا بهخودش جلب کرده و به قول باقربیگی باعث شده سرمایهگذارهای خارجی با گفتن WOW ابراز تعجب کنند، دستیار شخصی «پارسی» است؛ سامانهای شبیه دستیارهای صوتی خارجی مثل الکسا و سیری اما به زبان فارسی؛ سامانهای که خودشان میگویند از رقبای خارجی بهتر کار میکند، لهجههای مختلف را میفهمد و بعد از درک آنچه کاربر میگوید، جواب مناسب را برایش ارائه میکند. سمیه باقربیگی در گفتوگو با همشهری از جزئیات و فراز و نشیبهای فعالیت استارتاپی تا رسیدن به نقطه کنونی گفته است.
داستان یک سفر علمی
تولید دستیار صوتی یکشبه اتفاق نمیافتد. سمیه باقربیگی هم بعد از تحصیل در رشتههای مختلف ازجمله زبانشناسی و برنامهنویسی، چند سالی در آزمایشگاههای مرتبط مشغول فعالیت بود تا بتواند رسما و بهطور مستقل روی ساخت نرمافزارهایی هوشمند کار کند که تازه بازارشان در ایران رو به رشد بود.
اولین نرمافزار مستقل
اولین پروژه مستقل سمیه باقربیگی و همسرش، مهدی گلزارنیا، سامانهای بود که بعدها به نام «اولین موتور صوتی فارسی تلفنهمراه» مشهور شد. بازار هدف این محصول ابتدا افراد کمبینا و نابینا بود. این برنامه میتوانست برایشان متن پیامک یا هرچیزی که بهصورت نوشتاری در صفحه گوشی ظاهر میشد را بخواند. از آنجا که عمده بازار ایران در آن زمان در دست نوکیا بود، این برنامه برای موبایلهای آن شرکت تهیه شده بود. سمیه باقربیگی میگوید: «برخوردها با ما در سازمان بهزیستی بهشدت بد و غیرحرفهای بود. تا جایی که بهخودم قول دادم، هرگز به آنجا برنگردم، حتی اگر به باختم منجر شود». جامعه هدف کوچک و برخوردهای نامناسب در بعضی سازمانها باعث شد، کمکم به فکر بازارهای دیگری بیفتند.
تلاش برای فهمیدن لهجههای ایرانی
مدتی بعد، هردو تصمیم گرفتند سامانه تبدیل متن به گفتار تلفنی را برای سامانههای تلفنی تولید کنند؛ سامانهای که میتوانست روی تلفنبانک، منشی تلفنی و... کار کند. این ماژول میتوانست مشتریهای بزرگی مثل بانکها و شرکتهای بزرگ را هم جلب کند. واقعا هم همینطور شد. چند بانک و سازمان از این سامانه روی تلفنبانک و سامانههای تلفنی خود استفاده کردند. برای توسعه پروژهها و بهدستآوردن سهم بزرگتری از بازار، تصمیم گرفتند روی محصولات دیگری در حوزه هوش مصنوعی کار کنند؛ در نتیجه سامانههای جدید تشخیص چهره، نویسهخوان نوری، چتبات و سامانههای بازشناسی گفتار را راهاندازی کردند. باقربیگی میگوید: «یکی از جالبترین پروژهها، سامانه دستیار صوتی بود؛ چیزی شبیه سیری در آیفون که در آن کاربر میتواند دستوراتش را بهصورت صوتی ارائه کند و دستگاه براساس الگوهایی که برایش تعریف شده، پاسخهایی مناسب دهد. این سامانه میتواند لهجههای مختلف را شناسایی کرده و پاسخ مناسب ارائه کند». برای اینکه سامانه، دستورهای کاربر را دقیقتر و بهتر تشخیص بدهد، باید پیکره گفتاری بزرگی درست میکردند. یکی از بهترین راهها این بود که بایگانی صداهای آدمهای واقعی که کلمات خاصی را تلفظ میکنند در اختیار داشته باشند و بتوانند از طریق آن، به دستگاه آموزش دهند. گروه با ایده جمعسپاری توانستند نزدیک به 2هزار ساعت گفتار از لهجههای مختلف را جمعآوری کنند، برچسب بزنند و الگوریتمهای خود را با این دیتا آموزش دهند.
بومیسازی در ایران، توسعه در جهان
چتباتهای فارسی الان هم وجود دارند اما از آنجا که برای تشخیص گفتار از سرویسهای گوگل استفاده میکنند، عملکردشان در بعضی موارد نقص دارد. برای پوشاندن این نقطه ضعف، سمیه باقربیگی و همکارانش صفر تا صد ماجرا را خودشان انجام دادند و الگوریتمهای یادگیری ماشینی خودشان را تولید کردند و همین باعث میشود امکان شخصیسازی خدمات براساس درخواست مشتری فراهم باشد. ضمن اینکه چون گواهی تمام خدمات در شرکت تولید شده است، میتوانند سرویسها را روی سرور مشتری ارائه کنند، بدون اینکه به اتصال به سرورهای واسطهای مثل سرویسهای گوگل نیاز باشد. با این روش، امنیت سرویس بهتر تامین میشود؛ مسئلهای که بهخصوص برای بانکها اهمیت زیادی دارد. شرکت حالا و در میانه مسیر، 5سامانه مختلف را از صفر تا صد طراحی، پیادهسازی و تولید کرده است.
این محصولات بهصــورت Web API و Offline SDK برای برنامهنویسان ارائه میشود. با این حساب، برنامهنویسان میتوانند با استفاده از API تشخیص چهره یا بازشناسی گفتار در برنامههای خودشان استفاده کنند. اکنون پلتفرم این استارتاپ، زبان فارسی را پشتیبانی میکند و برنامه آیندهشان این است که زبان انگلیسی و فرانسه را نیز به پلتفرم خود اضافه کنند.
پژوهش در یک آزمایشگاه حرفهای
چند سالی که از ورود به دانشگاه گذشت، فهمید علایق دیگری هم دارد. سمیه باقربیگی عاشق فلسفه، روانشناسی و زبانشناسی شده بود. کارشناسیارشد رشته زبانشناسی را هم گذراند اما در همان سالها اتفاق عجیبی در دانشگاه شهیدبهشتی رخ داد؛ آنهم ساخت یک آزمایشگاه خاص بود که زبان را با رایانه مرتبط میکرد؛ آزمایشگاه پردازش زبان طبیعی به سرپرستی دکتر شمس فرد. خودش دراینباره میگوید: «تز فوقلیسانس من ساخت نیمهخودکار شبکه واژگانی افعال بود. در این پروژه دکتر شمس فرد استاد راهنمای من بودند و دکتر دبیرمقدم، رئیس گروه زبانشناسی دانشگاه علامه نیز مشاورم». کارکردن روی این پروژه خیلی بیشتر از آنچه تصور میکرد، زمان برد و برای پیشبرد آن، باید از همه مهارتهایش استفاده میکرد. همزمان بهصورت پاره وقت در شرکت نرمافزاریای کار میکرد که در همان جا، سمیه با همسر فعلیاش مهدی گلزارنیا آشنا شد؛ مردی که از همان زمان به او کمک کرد بتواند تزش را به شکل مناسبی ارائه کند. او و مهدی با هم ساختار جدیدی را شکل دادند که حالا به پایتخت فرانسه رسیده است.
مهاجرت استارتاپها فرار مغزها نیست
با وجود موفقیتهای شرکت، بهدلیل تحریمها عملا امکان سرمایهگذاری خارجی و توسعه فعالیت برای آنها وجود نداشت. به همین دلیل، آنها تصمیم گرفتند، برای دسترسی بهتر به بازارهای جهانی در استیشن اف حضور داشته باشند. از این طریق، شرکت امکان تعامل با سازمانهای مشابه و شرکتهای بینالمللی بزرگ را به دست میآورد. سمیه باقربیگی میگوید: «هدفمان توسعه سامانههای ایرانی در یک بازار بینالمللی است و این امکانات در فضایی مثل استیشن اف به خوبی فراهم شده است». او درباره اینکه رفتن استارتاپها از کشور به فرار مغزها تشبیه میشود، چندان خوشحال نیست و میگوید: «شرکتهای استارتاپی برای توسعه بازارشان ناچار به تعامل با جهان و ارائه سرویسهای خود به بازار جهانی هستند اما بهدلیل تحریمها و مشکلات مشابه، عملا از داخل ایران چنین امکانی فراهم نیست. ما بارها به نمایشگاههای مختلف خارجی رفته و توانستیم تا پای قرارداد هم پیش برویم اما صرفا بهدلیل تحریمها و مسائل بانکی نتوانستیم قراردادمان را امضا کنیم. همه ما دوست داریم کارمان را در ایران ادامه بدهیم و تجربههایمان قطعا برای کشور مفید خواهد بود اما زمانی این موضوع به نتیجه میرسد که سایه سنگین فشار از سر ما برداشته شود».
رؤیای فارسی حرفزدن با روباتها
سمیه باقربیگی از همان کودکی ساختن روبات و انجام کارهای عجیب را دوست داشت. این داستان سالهای اولیه زندگی اوست که از روباتسازی شروع میشود و تا نخستین پلههای شناخت زبان آدمآهنیها پیش میرود.
شاگرد درسخوان بود اما خجالتی. اهل شلوغبازی نبود اما زیاد مطالعه میکرد و فکرهای بزرگی از سرش میگذشت. یکی از عجیبترینهایشان شاید ساخت یک آدمآهنی بود؛ ایدهای که در اواسط دهه60 کمتر ذهن بچهها را مشغول میکرد. سمیه باقربیگی اما نهتنها به این موضوع فکر میکرد بلکه خیال داشت تصمیمش را هرطور هست عملی کند. اوایل تابستان 10سالگی تصمیم گرفت واقعا روبات بسازد و تمام 3ماه تابستان را در زیرزمین خانه گذراند تا تصمیمش را عملی کند. خودش میگوید: «روبات که نه، بیشتر شبیه عروسکی بود که به آن وسایل الکترونیکی و محاسباتی مثل ماشینحساب وصل کرده باشند. خودم میدانستم کار نمیکند اما این آخرین حد توانم بود. میدانستم یکجای کار میلنگد اما نمیدانستم کجاست. دستآخر رفتم پیش مادرم تا از او بپرسم مشکل کجاست و چطور باید حلش کنم. میدانستم تقریبا شکست خوردهام. اما چهره مادر وقتی عروسک روباتیک مرا دید، هیچوقت یادم نمیرود. طوری برخورد کرد انگار واقعا بهترین روبات دنیا را درست کردهام و هر دستوری که بدهیم اجرا میکند. تا مدتها بعد همین عروسک ماشینحسابی را به همه نشان میداد و با خوشحالی میگفت، دخترم مهندس روبات است! حال من را در آن مواقع تصور هم نمیتوانید بکنید؛ روی ابرها بودم».
مدتی بعد سمیه نوجوان فهمید، یکی از دلایلی که عروسک ماشینحسابیاش کار نکرده، این بوده که «برنامه» نداشته است. برای همین به فکرش رسید که برنامهنویسی یاد بگیرد. او میگوید: «بچه که بودم، رایانههای رومیزی کومودور تازه به بازار آمده بودند و پدرم بابت جایزه شاگرد اولی یکی برایم خرید. از طرفی، کلاسهای برنامهنویسی جالبی در دانشگاه شهید بهشتی برگزار میشد که میتوانستم در آنها بهصورت آزاد شرکت کنم. بهتر از این نمیشد، هم کلاس میرفتم و برنامهنویسی تئوری یاد میگرفتم، هم در عمل روی کامپیوترم که آن زمان پدیده مهمی بود، همهچیز را تمرین میکردم». او در دورانی کنکور داد که همه بر سر مهندسی برق و کامپیوتر رقابت میکردند. اما او سراغ چیزی رفت که دوست داشت؛ «مهندسی نرمافزار در تمام شهرهای ایران را انتخاب کردم و دست آخر، در همین رشتهای که دوست داشتم پذیرفته شدم.» علایق او اما همچنان در حال تغییرکردن است. انگار هرچند سال یکبار، سمیه باقربیگی بخشهای جدیدی از شخصیت خودش را کشف میکند.
مشکل تحریم بانکی
شرکتهای استارتاپی برای توسعه بازارشان ناچار به تعامل با جهان و ارائه سرویسهای خود به بازار جهانی هستند اما بهدلیل تحریمها و مشکلات مشابه، عملا از داخل ایران چنین امکانی فراهم نیست. ما بارها به نمایشگاههای مختلف خارجی رفته و توانستهایم تا پای قرارداد هم پیش برویم اما صرفا بهدلیل تحریمها و مسائل بانکی نتوانستهایم قراردادمان را امضا کنیم
شناخت لهجههای مختلف
یکی از جالبترین پروژهها، سامانه دستیار صوتی بود؛ چیزی شبیه سیری در آیفون که در آن کاربر میتواند دستوراتش را بهصورت صوتی ارائه کند و دستگاه براساس الگوهایی که برایش تعریف شده، پاسخهایی مناسب دهد. این سامانه میتواند لهجههای مختلف را شناسایی کرده و پاسخ مناسب ارائه کند