بومی‌سازی

هوش مصنوعی فارسی و حاکمیت داده

نویسندهتیم آپالکسا

تاریخ انتشار۲۲ اردیبهشت ۱۴۰۴

زمان مطالعه۷ دقیقه

هوش مصنوعی فارسی فقط مسئله ترجمه نیست. زبان فارسی ساختار، لحن، نشانه‌های اجتماعی، تاریخ، نام‌ها، اعداد، تقویم و رفتار نوشتاری خودش را دارد. اگر محصولی این واقعیت را درک نکند، حتی با یک مدل قدرتمند هم تجربه‌ای نیمه‌کاره می‌سازد. کاربر فارسی‌زبان به سیستمی نیاز دارد که زبان او را در سطح کاربرد روزمره و زمینه فرهنگی بفهمد.

در کنار زبان، مسئله حاکمیت داده قرار دارد. داده‌های شخصی، سازمانی و تجاری نباید بدون کنترل روشن از دست کاربر خارج شوند. برای آپالکسا، محصول‌هایی مانند آیرا و Barcode نشان می‌دهند که تجربه فارسی و مالکیت داده باید هم‌زمان دیده شوند. دستیار هوشمند یا نرم‌افزار کسب‌وکار وقتی قابل اعتماد است که هم درست بفهمد و هم مسئولانه نگه دارد.

زبان فارسی در محصول هوشمند چه می‌خواهد

فارسی در مکالمه واقعی پر از اشاره، حذف، تعارف، تغییر لحن و ترکیب واژه‌های رسمی و غیررسمی است. کاربر ممکن است در یک جمله از اصطلاح اداری، واژه انگلیسی، تاریخ جلالی و بیان محاوره‌ای استفاده کند. محصول هوشمند باید بتواند این ترکیب را بفهمد و پاسخ را با همان زمینه تنظیم کند.

در تجربه صوتی، این نیاز بیشتر دیده می‌شود. گفت‌وگوی صوتی فارسی فقط تشخیص کلمات نیست. مکث‌ها، اصلاح جمله، نام‌های خاص، اعداد و لحن درخواست روی فهم اثر می‌گذارند. آیرا با تمرکز بر دستیار فارسی‌زبان و گفت‌وگوی صوتی فارسی، این مسئله را در مرکز تجربه قرار می‌دهد.

وقتی سیستم حافظه بلندمدت هم داشته باشد، فهم زبان از سطح جمله فراتر می‌رود. دستیار می‌تواند بداند کاربر معمولا چه سبکی را ترجیح می‌دهد، روی چه پروژه‌هایی کار می‌کند و کدام اطلاعات برایش حساس‌اند. البته این حافظه فقط زمانی ارزشمند است که با کنترل و مالکیت داده همراه باشد.

حاکمیت داده یعنی کنترل واقعی

حاکمیت داده محلی به معنای شعار ضدجهانی نیست. مسئله این است که کاربر، کسب‌وکار و سازمان بدانند داده کجا نگه‌داری می‌شود، چه کسی به آن دسترسی دارد، چگونه پردازش می‌شود و چگونه می‌توان آن را مدیریت کرد. در محصولات هوشمند، این مسئله به دلیل حساسیت حافظه و تحلیل داده جدی‌تر می‌شود.

برای یک دستیار شخصی مانند آیرا، داده می‌تواند شامل برنامه‌ها، ترجیحات، مکالمات و الگوهای رفتاری باشد. برای نرم‌افزاری مانند Barcode، داده شامل موجودی، فروش، حسابداری، مشتریان و اسناد قانونی است. هر دو نوع داده ارزشمند و حساس‌اند، اما نیازهای متفاوتی دارند. طراحی محصول باید این تفاوت را بفهمد.

شفافیت درباره محل و شیوه نگهداری داده
کنترل کاربر بر حافظه و اطلاعات شخصی
هماهنگی با نیازهای زبان و تقویم فارسی
توجه به داده‌های مالی، قانونی و عملیاتی کسب‌وکار
پرهیز از وابسته کردن کاربر به زیرساخت مبهم و غیرقابل توضیح

هوش مصنوعی فارسی زمانی قابل اعتماد است که زبان کاربر را بفهمد و اختیار داده او را محترم بشمارد.

Barcode و واقعیت داده در خرده‌فروشی ایرانی

Barcode نمونه‌ای از محصولی است که داده را در زمینه کسب‌وکار ایرانی می‌بیند. خرده‌فروش ایرانی فقط به ثبت فروش نیاز ندارد. موجودی با بارکد، صندوق فروش، حسابداری، وفاداری مشتری، تقویم جلالی، ماده ۱۶۹، صورت‌حساب الکترونیکی و دفتر قانونی بخشی از واقعیت روزمره اوست. اگر نرم‌افزار این واقعیت را نشناسد، داده‌ها پراکنده و تصمیم‌ها ناقص می‌شوند.

وجود بیش از ۵۰ ماژول در Barcode به معنای تلاش برای پوشش فرایندهای متصل کسب‌وکار است، نه فقط انباشت قابلیت. وقتی فروش، انبار، حسابداری و مشتریان در یک جریان کاری منظم قرار می‌گیرند، مدیر فروشگاه می‌تواند تصمیم‌های دقیق‌تری بگیرد. اما همین تمرکز داده، مسئولیت امنیت و کنترل را نیز سنگین‌تر می‌کند.

پشتیبانی از وب، iOS و Android نیز از منظر حاکمیت داده مهم است. کاربر باید بتواند از کانال‌های مختلف کار کند، اما تجربه و داده‌های عملیاتی‌اش منسجم بماند. این انسجام باید با احترام به نیازهای محلی، قانون و شیوه کار روزمره کسب‌وکار ایرانی ساخته شود.

آیرا، حافظه و زبان شخصی

آیرا در سوی دیگر، با داده شخصی‌تر و مکالمه‌محور روبه‌روست. دستیار فارسی‌زبان اگر حافظه بلندمدت داشته باشد، می‌تواند تجربه‌ای پیوسته‌تر بسازد. اما همین حافظه باید به گونه‌ای طراحی شود که کاربر احساس کنترل داشته باشد. اعتماد از اینجا شروع می‌شود که کاربر بداند دستیار چه چیزی را به خاطر می‌سپارد و چرا.

حافظه در آیرا، وقتی روی بنیان‌هایی مانند CognitivX و iCog شکل می‌گیرد، می‌تواند از تعامل‌های پراکنده یک مدل زمینه‌مند بسازد. کاربر در جلسه بعدی لازم نیست همه چیز را تکرار کند. دستیار می‌تواند گذشته مرتبط را به یاد بیاورد، اما باید درباره اطلاعات حساس محتاط بماند.

برای فارسی‌زبانان، این موضوع فقط راحتی نیست. زبان مادری محل شکل‌گیری تصمیم، احساس و اعتماد است. وقتی سیستم با زبان کاربر درست رفتار می‌کند و داده او را بی‌صاحب نمی‌بیند، رابطه کاربر با هوش مصنوعی از استفاده آزمایشی به استفاده پایدار نزدیک می‌شود.

جمع‌بندی: آینده هوش مصنوعی فارسی با اعتماد ساخته می‌شود

محصول فارسی موفق باید هم زبان را عمیق بفهمد و هم داده را مسئولانه مدیریت کند. یکی بدون دیگری کافی نیست. دستیار فارسی بدون حاکمیت داده، اعتماد پایدار نمی‌سازد. نرم‌افزار داده‌محور بدون تجربه زبانی درست نیز برای کاربر ایرانی کامل نخواهد بود.

آیرا و Barcode از دو مسیر متفاوت به یک اصل مشترک می‌رسند: محصول باید با واقعیت فارسی‌زبان و ایرانی طراحی شود. این واقعیت در مکالمه، حافظه، تقویم، قانون، فروش، حسابداری و مالکیت داده حضور دارد. هوش مصنوعی فارسی وقتی بالغ می‌شود که همه این لایه‌ها را با هم ببیند.

ادامه‌ی خواندن

یادداشت‌های دیگر

زیرساخت شناختی

چرا هوش مصنوعی باید به‌خاطر بسپارد

بیشتر دستیارهای هوش مصنوعی پس از هر گفت‌وگو همه‌چیز را فراموش می‌کنند. حافظه‌ی پایدار، تفاوت میان یک ابزار و یک همراه واقعی است.

فلسفه

نرم‌افزار آگاهی‌محور یعنی چه؟

آگاهی‌محور بودن یک شعار نیست؛ یک تصمیم مهندسی است. یعنی حافظه، زمینه، مسئولیت و رشد انسان را از همان ابتدای طراحی جدی بگیریم.