امیدواریم روزی در گوشی همراه هر ایرانی یک «نوا» باشد
سید فرید فاضل مجتهدی متولد 1371 و زاده شهر اردبیل است. کارشناسی و کارشناسی ارشد خود را در رشته عمران در دانشگاه شریف گذرانده به گفته خودش همیشه دوست داشت روی پای خودش باشد؛ به همین دلیل از همان بدو ورود به دانشگاه به فکر کار کردن و راهانداختن کسبوکار خودش افتاد. تا اینکه از چند سال پیش به همراه چند نفر از دوستانش (محسن سالاری، مهرداد فرج تبار و محمد فرج تبار) که همگی از دانشجویان دانشگاه شریف بودند متوجه وجود یک خلا در حوزه هوش مصنوعی ایران شد و آنهم قسمت پردازش زبان طبیعی و پردازش گفتار بود. او و دوستانش چند سال در این حوزه تحقیق کردند تا اینکه اوایل سال 96 بصورت حقوقی، شرکت فناوران اطلاعات سخن را تأسیس کرد و توانستند تا پایان سال 96 آن را به شرکت دانشبنیان تبدیل کنند. یکی از محصولات آنها موتور هوش مصنوعی یا دستیار صوتی هوشمند به نام «نوا» است که میکوشد به درخواستهای صوتی و متنی کاربران پاسخ دهد.
گفتنی است استارتاپ فناوران اطلاعات سخن در چهارمین نمایشگاه تراکنش ایران که ماه گذشته در بوستان گفتگوی تهران برگزار شد توانست به عنوان یکی از سه تیم برتر برگزیده شود. به همین بهانه، آی چیزها به سراغ مؤسس این شرکت دانشبنیان، فرید فاضل رفته است تا از فراز و نشیبهای تیم سخن از ابتدا تا امروز بداند:
سخن کیست و چیست و از کجا آمده است؟
ما از سال 92 این ایده را شروع کردیم؛ اینکه کشورهای پیشرفته از هوش مصنوعی بهره میبرند و چند تا دستیار صوتی در چهان وجود دارد مثل سیری اپل، گوگل اسیستانت، کورتان مایکروسافت، الکسا آمازون که هرکدام کاردبردهای خاص خودشان را دارند. دیدیم که جهان دارد به این سمت میرود و گفتیم که بیاییم و این ایده را ایرانیزه کنیم. یعنی مردم ما که مشکل زبان انگلیسی هم دارند به صورت فارسی، چه به صورت متنی و چه به صورت صوتی با یک دستگاه و در بسترهای مختلف با ما در ارتباط باشند.
از سال 92 با پیامک شروع کردیم؛ به این شکل که کاربر به صورت متنی میپرسید که برای مثال سینما آزادی چه فیلمی داره؟ افطار چه زمانی هست؟ چواب میگرفتین. حوزه مورد علاقه و هدف ما هم VAS یا ارزش افزوده بود؛ یعنی میخواستیم آن حوزه را در دست بگیریم. به آن سرویسهایی که پیامکهای برای مثال فوتبالی میفرستادند بگوییم کاری کنند که بر اساس نیاز دریافت کننده پیام تماس بگیرند. یعنی مثلاً پیامک بزنند و بگویند الان تیم تراکتور چندم جدول است. شاید شما هم تجربه کرده باشید که بعد از مدتی بسیاری از کاربران پیامکها را آف می کنند چون نیازی ندارند.
از حوزه 2G گذر کردیم و از سال 92 تا 96 در ایران حوزههای دیگری مثل 3جی نیز وارد شد و با انقلابی روبرو بودیم که با رشد اپلیکیشنها همراه بود. ما احساس کردیم که موتوری که داریم لازم است در بستر اپلیکیشن خودش را نشان بدهد.
مشکلی هم که آن زمان به هنگام مذاکره با ارگانها و سازمانهای مختلف این بود که پس از اینکه توضیح میدادیم موتور هوش مصنوعی داریم از ما خروجی ملموس و عینی میخواستند. از سوی دیگر، اپلیکیشن جذابیت دارد درحالی که حوزه متن برایشان جالب توجه نبود. متوجه شدیم که باید ویترین خوشگلی برایش طراحی کنیم که وقتی مدیر سازمان یا ارگان به آن نگاه میکند UI و UX خوبی را تجربه کند. این بود که سال 96 به سمت اپلیکیشن رفتیم.
اما ساخت اپلیکیشن نیاز به برنامه نویس آی او اس و اندروید و طراح داشت، در ابتدای کار 4 نفر بودیم. بنابراین با مطرح شدن نیاز به ساخت اپلیکیشن لازم بود افزایش نیرو داشته باشیم و کارمان بازوهای بیشتری به خود بگیرد. از طرف دیگه علاقهای به سرمایه و جذب سرمایه گذار نداشتیم.
ما درحال حاضر 15 بخش هستیم. 10 نفر داخل ایران هستیم و 5 نفرمان در آمریکا هستند که یا دانشجویان دانشگاههای معتبر و یا دانش آموخته آنجا هستند. مثلاً یکی از اعضای تیم در گوگل کار میکند و در قسمت فنی به ما کمک میکند.
از این 4 نفر زمان تأسیس، دو نفرشان دانشجوی دکترای آمریکا بودند. در همین اثنا متوجه شدیم که بنیاد ملی نخبگان طرحی دارد و آن طرح حمایت از نخبگان خارج از کشور است. کار به این صورت بود که طرح در بنیاد ارائه میشد و پس از تأیید از سوی بنیاد ملی مخبگان یک بازوی نظارتی به تیم ارائه دهنده داده میشود. به اضافه مبلغ کمکی.
این اتفاق چه زمانی برای شما افتاد؟ شما طرحی ارائه دادید؟
سال 96 ما با دو طرح در بنیاد ملی نخبگان شرکت کردیم. یک طرح با NLP یا پردازش زبان طبیعی و یک پروژه هم در قالب ای اس آر یا تبدیل گفتار به متن بود.
بازوی نظارتی شما که بود؟
پژوهشکده فناوری اطلاعات دانشگاه شریف به ریاست دکتر ربیعی بازوی نظارتی ما شدند. این طور نیست که پول را به شما بدهد و بتوانید هر کاری که دوست دارید با آن بکنید؛ بلکه نظارت میکند و از روند کار و پیشرفت آن گزارش می گیرد.
دو تا هم شرط دارد؛ یکی که اپلیکیشن بالا بیاد که بتوان دمو کرد و دیگر اینکه دانش بنیان بشویم. با انجام این دو شرط ما اواخر سال گذشته هم دانش بنیان شدیم و هم اینکه اولین اپلیکیشن دسنیار صوتی هوشمند به اسم «نوا» تهیه شد. که هم به صورت صوتی و هم به صورت متنی می توانید با آن در تعامل باشید و سؤل بپرسید.
نوا دقیقن چه کار می کند؟
موتور هوش مصنوعی ما «پرسا» است و ادعا می کند که هرچه از آن بپرسید جواب می دهد. یکی از محصولات پرسا که ویترین کار ما است و برای شناختن دیگران بهتر است نوا است.فرودگاه، رایتل، دولت همراه. درحدود 15 سرویس دارد. نوا مثل سری اپل، گوگل اسیستانت و کورتان مایکروسافت است و الکسا آمازون است. میتوان سؤال پرسید و منتظر جواب ماند. مثلاً میشود پرسید آیه 125 سوره بقره را برای من بیاور یا یک ترانه از یک گروه موسیقی را برایم پخش کن. آب و هوا و نرخ ارز و سکه، بازی پانتومیم و مواردی از این دست مثالهایی از کاربردهای نوا هستند. هوش مند بودن این موتور در اینجاست که اگر به صورت غیرکتابی با او صحبت کنید متوجه میشود.
فعالیت شما از سال 96 به چه صورت پیش رفت؟ آیا مشتری داشتید؟
پس از کسب آن پیش شرطها نیروهایمان افزایش یافت، و پروژه گرفتیم. اولین پروژه ما در مورد دولت همراه بود که قرار است همه کارهای دولتی از قبیل کارت سوخت مجهز به پردازش زبان طبیعی یا ان ال پی شود. در قسمت تماسهای اورژانسی این اپلیکیشن طوری طراحی شده است که برای مثال کاربر میگوید خانه م آتش گرفته است و از طریق پیاک با آتش نشانی تماس گرفته میشود یا از حال جسمانی بد خود خبر میدهد و میتواند به 115 زنگ بزند. قرار هست روی همه سرویس های دولت همراه، ان ال پی سوار شود.
مشتری بعدی ما شهر فرودگاهی امام خمینی بود؛ اولین اپلیکیشن هوشمند فرودگاهی در ایران که در آخرین روز کاری آقای آخوندی، وزیر افتتاح شد. این اپلیکیشن قرار است حدود 30 تا 40 سرویس ارائه دهد، آنهم به صورت هوشمند، هم صوتی و هم متنی. کاربر میتواند بپرسد پرواز ایران-دبی چه زمانی مینشیند؟ پرواز تهران-استانبول چه زمانی میپرد؟ به صورت عامیانه میپرسد؛ می تواند مسیریابی انجام دهد، یعنی چطور میتوانم به فرودگاه بروم؟
مشتری بعدی ما که در نمایشگاه تلکام هم دمویی از آن رفت و آقای جهرمی، وزیر ارتباطات هم از آن دیدن کردند به این صورت هست که در اپلیکیشن «مای رایتل» قرار است سرویس ارائه دهیم، یعنی همان موتور هوش مصنوعی ما. به جای جستجوهای طولانی کاربر برای پیدا کردن بسته مناسب به صورت صوتی درخواستش را میگوید و هدایت میشود برای خریداری آن. یا حتی میتواند پیام شکسته شکسته باشد. مثلاً یک بسته اینترنتی میخواهم. موتو هوش مصنوعی ما میپرسد، شبانه می خواهی یا روزانه و الی آخر. مثل این است که گویی داری با دوستت صحبت میکنی.
درحال حاضر هم پروژهای دارید؟
بله با بانکی درحل تعامل هستیم، اما به دلیل محرمانه بودن نمیتوانم نامی از بانک مورد نظر ببرم. اما قرار است در سرویسهای موبایلی بانک پیاده شود.
آیا قابلیت این موتور هوش مصنوعی تنها برای اپلیکیشنها کارایی دارد؟
خیر، نباید این تصور را داشته باشید، برای مثال چت آنلاین روی وبسایتها است. می دانید که روی بسیاری از وبسایت، سمت راست پایین صفحات قسمتی برای پرسش و پاسخ با اپراتور در نظر گرفته شده است. درحالی که نیازی به این همه اپراتور نیست. میتوان این چت را با موتور هوش مصنوعی ما انجام داد. یا در مراکز تماس. یکی از پروژه های ما تبدیل گفتار به متن است. اگر دموی گوگل اسیستانت را دیده باشید میشود زنگ زد هتل و رزور کرد بی آنکه متوجه شوید در حال صحبت با یک موتور هستید. اینجا هم میتوانیم به مراکز تماس خدمات ارائه بدهیم و به جای آنکه تعداد زیادی اپراتور پاسخگوی کسی باشد از طریق موتور ارتباط برقرار شود. بخش بعدی پیامک است. می دانیم که بسیاری از سازمانها سرویس پیامکی دارند. با موتور ما میشود به جای جستجوها و فرستادن کدهای مختلف چیزی که دقیقاً نیاز دارید را بنویسید. بخش بعدی اپلیکیشنها است و پیام رسانهای دخلی و خارجی که از طریق باتها پیام ارسال میشود دیگر لازم نیست و با ما صحبت میکنند. هم به صورت متنی هم به صورت صوتی.
بزرگترین دغدغه شما در این حوزه چیست؟
ما دو دغدغه اصلی داریم. هرچیزی که در آمریکا یا اروپا پیاده سازی میشود، 50 تا 100 دیگر در ایران مد و انجام می شود چون الان همین سیستم ها مثل الکسا و غیره در تمام خانه های آمریکا جا نیفتاده است و درحال پیشرفت است. ما همان تکنولوژی را داریم در ایران سرویس میدهیم. به همین خاطر بسیاری از سازمانها و ارگانها فعلن به فکر user-friendly بودن خودشان نیستند و میگویند که فعلاً دارد کارمان را راه میاندازد اما این حرکت و سفارشی کردن موتور هوش مصنوعی و اضافه کردن آن به قسمتهایی که خدمات ارائه میدهد مثل اپلیکیشنها و سایتها، باعث راحتی کار کاربرانشان میشود. اما قانع کردن سازمانها و اینکه بگوییم این کار به نفع شماست کمی سخت است؛ اما میل به سنتی عمل کردن همچنان وجود دارد. درحالی که روی آوردن به هوش مصنوعی به راحتی کاربر میانجامد؛ او میتواند با یک صحبت کوتاه نیازش را برطرف کند. یکی از نیازهای اساسی ما این است که دید سنتی به ماجرا دارند.
بخش دیگر کمبود شدید دادهها در این حوزه است؛ چه به صورت متنی و چه صوتی. ما نیازمند تعلیم بسیار زیاد موتور هوش مصنوعی خود هستیم. هوش مصنوعی مثل یک بچه است که همواره درحال بزرگ شدن و تجربه کردن و یاد گرفتن است. مسلماً در ابتدا که موتور هوش مصنوعی ساخته میشود شاید دقتش درحد 80 درصد باشد اما به تدریج با تعامل کاربرها یاد میگیرد و دقتش روز به روز کاملتر میشود. رسیدن به این مرحله نیازمند داده هست. در ایران داده زیادی در دسترس نیست و حتی مراکز تماس موجود در ایران چون تنها در آن لحظه میخواهند نیازشان را برطرف کنند به فکر گزارش کردن دادهها نیستند و تنها جواب میدهند.
ماهیت توسعه هوش مصنوعی در ایران در چه وضعیتی قرار دارد؟
خوشبختانه با وجود شرکتهایی مثل ما حتماً به سمت توسعه بیشتر و بهتر خواهد رفت. فارغ از سنتی رفتار کردن برخی شرکتها، شرکتهایی هم وجود دارند که ابزار تمایل میکنند نسبت به ارزش هوش مصنوعی و بهره گرفتن از آن. مثلاً شهر فرودگاهی بسیار از این طرح استقبال کرد. البته بعید نیست مدیران ارشد سازمانها هم نقش مهمی در این پذیرش یا عدم پذیرش داشته باشند. شاید همینکه مدیر ارشد آن سازمان از دانشگاه شریف بود و ارزش کار را متوجه شد به ما خیلی کمک کرد تا پیاده سازی در این زمینه صورت بگیرد. یا مدیران ارشد شرکت رایتل خودشان ارزش کار فهمیدند. مسلماً چهان درحال رفتن به سمت هوش مصنوعی است. ایران هم میرود اما سرعتمان کم است.
جایگاه خودتان را در میان رقبا چطور میبینید؟ مزیت رقابتی شما چیست؟
ما از سال 96 تاکنون حدود 3-4 تا مشتری داریم و به آینده بهتر امید داریم. شرکتهای مشابه ما از انگشتان دست کمتر هستند. اما مزیت رقابتی ما توجه ما به بافت گفتگوهاست و تک تک واژگان در پیشینه و بافت موجود مورد بررسی قرار میگیرند. موتور جستجوی ما مثل انسان است که با شما وارد تعامل میشود.
اگر بخواهیم برای این مزیت نامی بگذاریم می گویید شما باهوش تر هستید؟
ما در یادگیری ماشین قویتر عمل میکنیم. نکته دیگر که خودش را در حوزههای حساس نشان میدهد تک تک کلمات در جمله است. مثلاً شما ممکن است بپرسید اذان مغرب چه ساعتی است؟ و بعد میپرسید دیروز اذان مغرب کی بود؟ در اینجا تنها اوقات شرعی مد نظر نیست، بلکه زمان دیگری یعنی دیروز هم مورد پرسش است. این موضوع در حوزههای بانکی خودش را به خوبی نشان میدهد و حساستر میشود. اینکه در حساب بانکی شما چقدر پول است، هفته پیش چقدر بوده و غیره.
با توجه به اینکه هوش مصنوعی خودش قدمت خیلی زیادی در جهان ندارد و کشور ما هم در این مقوله عقبتر بوده است. برای راه اندازی این ایده در صورت نبود حمایت از سوی دولت یا کمبود سرمایه باید چه کرد؟ چه توصیه ای دارید؟
توضیحات من در مورد حوزه تخصصی خودمان یعنی پردازش زبان طبیعی بود اما هوش مصنوعی خودش حوزه گستردهای است که میتواند حتی هوش کسب و کار را هم در بر بگیرد. این سؤال شما بستگی به «امید» دارد. ما که خودمان از 92 شروع کردیم تا امروز که در سال 97 هستیم هنوز دخل و خرمان یکی نشده است. ولی نزدیک نقطه سر به سر هستیم. به آینده امید داریم چون وضعیت موجود در جهان و گزارش های قبلی همواره نشان داده است که ایران بعد از آمریکا و ژاپن وارد حوزه شده است.
ما در تیممان هم دانشگاه شریفی داریم اما همکارهایی داریم از دانش آموختگان دانشگاه آزاد که بسیار خوب عمل میکنند و شاید حتی بهتر از دانشجویان شریف. طبیعی است که بعضی حوزه ها خودشان را دیرتر نشان میدهند مثل غذا و بازی اما بیشتر از هرچیز ایده مهم است.
آیا شما را می شود استارتاپ نام گذاشت؟
ما زا طرف بنیاد ملی نخبگان و طرح حمایت از دانشجویان خارج ازکشور پشتیبانی شدیم چون پروپوزال از سمت دوستانی که در خارج از ایران هستند آمده است. به نوعی میشود گفت استارتاپ بودهایم.
با این تفاسیر آیا جماعتی دارید که مختص دوستان فعال در زمینه هوش مصنوعی باشد؟
انقدر تعداد بچه های هوش مصنوعی کم است که شاید تعداد شرکتها و استارتاپ هایی که واقعاً درحال کار در این حوزه باشند به تعداد انگشتان دست هم نرسد. اما در نمایشگاهها علاقه وافری نسبت به این موضوع وحود دارد که همه پسوند هوشمند را به شرکت و محصولشان اضافه کنند. اما در واقع با ورود به شرکتها متوجه میشوید که طبل توخالی هستند. تا جایی که می دانم جماعت سازی صورت نگرفته است اما لازم است چون میتوانیم جای خالی همدیگر را پر کنیم و هم افزایی شکل بگیرد و دغدغه های همدیگر را بشناسیم.
به نظر میرسد که عدم رسانهای کردن این کار باعث میشود فعالیت شما در حلقه تخصصی و معمولاً آکادمیک باقی بماند و مردم عادی از آن بی خبر باشند.
درست است. ما آن تجربه را در نمایشگاه تلکام داشتیم. وقتی با مردم مصاحبه میکردیم که آیا اصلاً از وجود چیزی به اسم پردازش طبیعی با خبر هستید یا گروه ما را میشناسید که مثل سیری اپل یا گوگل اسیستانت به صورت فارسی درحال خدمترسانی هستیم جواب منفی بود. دلیل اینکه رسانهای نکردهایم این است که قرار است به زودی نسخه آ او اس اپلیکیشن ما روانه بازار شود و منتظر هستیم به محض تکمیل آن و قرار گرفتن آن در کنار نسخه اندروید وارد تبلیغات میشویم.
پس چشم اندازی که پیش روی شرکت فناوران اطلاعات سخن میبینید چگونه است؟
اگر بخواهم از افق طولانی مدتمان بگوییم این است که روی گوشی هر ایرانی، یک «نوا» وجود داشته باشد که سرویسهای زیادی ارائه دهد. درحال حاضر 15 سرویس داریم که تا پایان سال آینده میخواهیم آن را به 50 الی 60 سرویس برسانیم. که بازهم رقم کمی است و باید به 300 سرویس برسد. درحال حاضر 1700 سناریو داریم که میتوانیم ارائه دهیم اما چون به ازای ارائه دادن هر کدام یک ماه تا دو ماه طول میکشد به تدریج اضافه خواهیم کرد. همچنین نیروهای انسانی و سرعتمان را هم افزایش خواهیم داد تا سرویسهای بیشتری ارائه کنیم. چون هرچقدر سرویس اضافه شود نیازهای مردم با راحتی بیشتری برطرف میشود.
چطور این نیازها را شناسایی میکنید؟ آیا شما مخاطب هدفی ندارید؟
ما اتاق فکر داریم، به صورت مستمر با ارسال شناسنامه به بخشهای مختلف تهران و همچنین دیگر شهرها از نیازهای مردم باخبر میشویم. این 15 سرویس کنونی هم بر اساس تهیه پرسشنامههایی بوده است که از طرف مردم پاسخ داده شده است. به تدریج اولویت بندی کردهایم و میدانیم باید به کدام سمت برویم. البته که اولویتها تغییر میکند و در طول زمان ممکن است یک اولویت برای مردم زیاد شود و ما آن را وارد کار خواهیم کرد.
بخش بعدی که احتمالاً میخواهیم سال آینده به سمتش برویم ساخت دستگاههایی مشابه اکو گوگل الکسا و آمازون است که در آینده خانه هر ایرانی چنین دستگاهی باشد. اما فعلاً بدون اینکه با تلویزیون و چراغ در ارتباط باشد و بیشتر با ارسال پیام کار کند. برای این کار، میتوانیم با استارتاپها و شرکتهای دیگر که ارائه کننده خدمات حمل و نقل یا غذا یا اخبار روز هستیند این دستگاه را در قالب ایرانی عرضه کنیم.
بنابراین میخواهیم به سمت اینترنت اشیا به صورت مشخصتر هم برویم. در نهایت اینکه به جایی برسیم که اکثر ارگانها و سازمانها به سازگار بودن خدماتشان با نیازهای کاربرانشان فکر کنند تا مشتریان و مراجعه کنندگانشان سادهتر با آنها در تعامل باشند. مثال خوبی که میتوانم در این مورد بزنم، شهرداری تهران است. درحال حضار مدت زمان طولانی برای رسیدگی به یک درخواست طول میکشد اما میشود کیوسکهایی طراحی کرد که با ارسال پیام صوتی یا متنی از طرف متقاضی مراحل انجام درخواست و پیگیری روی یک پنل یا صفحه نمایش ظاهر شود. همین اتفاق میتواند در بیمارستانها و هتلها هم رخ دهد. اما فعلاً دغدغه اصلی این است که صاحبان کسبوکارهای مختلف میگویند با همان سیستم قبل پیش میرویم. در واقع تکنولوژی چدید هنوز جا نیفتاده است. سختی کار اینجاست که بانکهای آمریکا دستیار صوتی واقعاً کامل مالی در حد و اندازه مشاوره اقتصادی دارد. ما این توانایی را داریم که این سرویس را به بانکها بدهیم ولی بانکها نمیپذیرند.
آیا دلیل این اجتناب، به دلایل امنیتی هم میتواند باشد؟
خیر، ما در حال حاضر این توانایی را داریم که کل موتور هوش منصوعی خود را روی سرورهای سازمان ها پیاده سازی کنیم. حتی میتوانیم گفتار کاربر را تشخیص دهیم و تأیید کنیم که از صحت هویت او هم مطلع شویم. همچنین ما میتوانیم پردازش تصویر هم داشته باشیم. هوش مصنوعی این مزیت را دارد که شما میتوانید با متنهای مختلف، کارهای جالبی کنید. در واقع تحلیل احساس، مزیت رقابتی شرکتهایی مثل ما است که روی پردازش زبان طبیعی کار میکنند.
مصاحبه و تنظیم: تمنا منصوری
بیشتر بخوانید: نوآوری آینده یعنی هوش مصنوعی و یادگیری ماشین؛ گفتگو با محمد احمدی، گفتگو با محمد احمدی، مدیرعامل و همبنیانگذار اسمارت آپ