چرا همه مدل های هوش مصنوعی یکسان نیستند؟
چرا همه مدلهای هوش مصنوعی عملکرد مشابهی ندارند؟ برخی دستور متنی شما را جواب میدهند. در حالی که تخصص برخی تولید تصویر و یا ترجمه متون است. چه چیزی باعث این تفاوت در عملکرد میشود؟ جواب در زیرساخت آنها است. مدلهای هوش مصنوعی میتوانند بر اساس معماری، هدف تولید، سخت افزارها و اطلاعاتی که از آن تغذیه میکنند متفاوت باشند.
احتمالا شما نیز با مدلهای هوش مصنوعی مختلفی که هرکدام بر اساس هدف خود کاربرد متفاوتی دارند کار کردهاید. مثلا ChatGPT که به سوالهای شما در هر زمینهای پاسخ میدهد. یا DALL-E که بر اساس متن ورودی شما عکس تولید میکند و یا Tesla AI که در ماشینهای خودران استفاده میشود. در ادامه به دلایل تفاوت مدلهای هوش مصنوعی و مقایسه آنها میپردازیم.
اهمیت معماری در AI
معماری یک مدل، هسته محاسباتی آن است. مثلا از ترانسفورماتور برای ترجمه زبان یا از مدل CNN برای تصاویر استفاده میشود. همچنین مدلهای RNN و LSTM برای پردازش اطلاعات متنی متوالی مانند تشخیص گفتار یا ترجمه ماشینی مناسب میباشند. هرکدام از این مدلها نیازمند سخت افزار خاص خود هستند که بر اساس پیچیدگی محاسبات میتواند متغیر باشد. برای مثال مدل CNN معمولا به پردازندههای گرافیکی (GPU) برای انجام محاسبات نیاز دارد. درحالی که مدلهای RNN و LSTM به دلیل نیاز به پردازش دنبالههای زمانی ممکن است به منابع مختلفی احتیاج پیدا کنند.
دادههای آموزشی AI
دادههای آموزشی مدلهای هوش مصنوعی را تغذیه میکنند و تفاوتهایشان را میسازند. این اطلاعات برای ذخیره شدن فضای زیادی نیاز دارند که نیاز به سیستمهای ذخیره سازی قوی را بیشتر میکند. برای مثال یک مدل اطلاعات دارای فیلتر و سانسور را انتخاب میکند در حالی که مدل دیگر اطلاعات خام را از وب میگیرد. نوشته ریچارد ساتون، پروفسور دانشگاه آلبرتا با عنوان “درس تلخ” نشان میدهد حجم و نوع اطلاعات همه چیز را برای یک مدل هوش مصنوعی عوض میکند. محققان برای مدلها به دنبال بهترین نوع اطلاعات هستند و مدیران فناوری ابزارها را برای مدیریت آنها آماده میکنند. اینجا جاییست که تفاوت در مدلها شکل میگیرد و هرکدام عملکردی منحصر به فرد از خود نشان میدهند.
اطلاعات خوب و تمیز میتوانند زمان مورد نیاز برای آموزش یک مدل را به میزان قابل توجهی کاهش دهند. وقتی اطلاعات تمیز و به خوبی آماده شوند، مدل میتواند سریعتر یاد بگیر و به عملکرد بهتری دست یابد. به دست آوردن دادههای آموزشی با کیفیت بالا اغلب یک کار چالش بر انگیز است و نیاز به منابع زیادی دارد. در این بخش چند روش متداول برای به دست آوردن دادههای آموزشی را توضیح میدهیم:
جمع آوری اطلاعات (AI Data Collection):
شما میتوانید اطلاعات خود را توسط سنسورها (مانند دوربین یا میکروفون) یا تکنیکهای Data Scraping جمع آوری کنید. این روش به شما اجازه میدهد با توجه به نیازی که دارید اطلاعات خاص خود را بدست آورید.
مجموعه اطلاعات عمومی (AI Public Dataset):
بسیاری از سازمانها و مراکز تحقیقاتی مجموعه اطلاعات عمومی را برای وظایف مختلف ارائه میدهند. برای مثال میتوان از ImageNet برای طبقه بندی تصویر و مجموعه Common Crawl برای متون وب نام برد.
خدمات برچسب گذاری اطلاعات (AI Data Labeling Services):
اگر به اطلاعات برچسب دار نیاز دارید، میتوانید از خدمات برچسب گذاری داده کمک بگیرید. این سرویسها از حاشیه نویسهای انسانی برای برچسب گذاری اطلاعات بر اساس مشخصات شما استفاده میکنند.
مشارکت با سازمانهای دیگر (AI Data Partnership):
همکاری با سایر سازمانها یا ارائه دهندگان اطلاعات میتواند منبع ارزشمندی برای اطلاعات آموزشی باشند. این مشارکت میتواند شامل قراردادهای اشتراک داده یا مشارکت برای جمع آوری اطلاعات باشد.
تولید دادههای مصنوعی (AI Synthetic Data Generation):
در برخی موارد، میتوانید دادههای مصنوعی را برای تکمیل مجموعه خود تولید کنید. این کار به ویژه زمانی مفید است که اطلاعات دنیای واقعی کمیاب یا گران قیمت باشد.
فرایند آموزش هوش مصنوعی
فرایند آموزش هوش مصنوعی میتواند به عوامل متعددی مانند موارد استفاده و نوع دادههای درگیر بستگی داشته باشد. با این حال، به طور کلی این فرایند را میتوان به چند مرحله تقسیم کرد که در این بخش، آنها را توضیح میدهیم:
1. جمع آوری داده (Data Collection):
دادهها شاهرگهای یک هوش مصنوعی هستند و دادههای خوب مدلهای خوب و قوی را میسازند. ساخت یک هوش مصنوعی قدرتمند با انتخاب اطلاعات و جمع آوری آنها در یک مکان شروع میشود.
2. پیش پردازش دادهها (Data Preprocessing):
این مرحله شامل آماده سازی اطلاعات برای آموزش است. اگر بخواهیم از یک تشبیه آشپزی استفاده کنیم، مرحله اول جمع آوری مواد و مرحله دوم برش دادن و آماده سازی برای پخت و پز است. این مرحله سه بخش دارد. بررسی داده از نظر متناسب بودن و کامل بودن، قالب بندی اطلاعات برای آموزش، پاکسازی اطلاعات از خطا و مشکلات.
3. انتخاب مدل (Model Selection):
انتخاب مدل مورد نظر به موارد استفاده بستگی دارد. این انتخاب حوزه کار متخصصان علوم داده است و پیچیدگی زیادی میتواند داشته باشد. چند مثال از این مدلها عبارتند از:
- مدلهای یادگیری تقویتی (Reinforcement Learning Models): این مدلها تعدادی شبیه سازی را اجرا میکنند که در آن هوش مصنوعی سعی میکند بر اساس آزمون و خطا خروجی تولید کند و یا به هدفی برسد.
- مدلهای یادگیری عمیق (ِDeep Learning Models): این مدلها از شبکههای عصبی عمیق برای یادگیری از اطلاعات استفاده میکنند. مدلهای یادگیری عمیق میتوانند از اطلاعات تغذیه کنند و با هر تکرار، این اطلاعات را تشخیص و تمایز دهند. برای مثال شما تصویری را به این مدل میدهید و این مدل در تکرار اول وجود مبل را در تصویر تشخیص میدهد. ممکن است در چرخه یادگیری بعدی این مدل تفاوت انواع مبل و صندلی را نیز تمایز دهد و مشخص کند.
4. آموزش مدل (Training):
در مرحله نهایی ما مدلی را که انتخاب کردیم آموزش میدهیم. این پروسه میتواند بر اساس مدل انتخابی متفاوت باشد. اما به طور کلی، ماشین مجموعهای از آزمایشها و شبیه سازیها را اجرا و پیش بینی میکند. سپس این پیش بینیها را با هدف و یا نتیجه مورد انتظار مقایسه میکند. در طول چرخهها و آموزشهای متعدد مدل هوش مصنوعی مورد نظر تنظیم میشود و آمادگی لازم را پیدا میکند.
5. ارزیابی (Evaluation):
پس از تکمیل آموزش، نوبت ارزیابی و تست آن میرسد. معمولا مدل هوش مصنوعی را روی مجموعهای کوچک از کارهای دنیای واقعی آزمایش میکنند تا از عملکرد مطلوب آن اطمینان پیدا کنند. در صورت رضایت این مدل به مراحل بالاتر میرود و اگر نتایج مطلوب نباشند به احتمال زیاد به آموزش مجدد باز میگردد.

هدف هوش مصنوعی
بسته به اهداف و چشم اندازی که سازمانها یا افراد برای یک هوش مصنوعی دارند، این مدلها میتوانند متفاوت باشند. برای مثال برخی به دنبال انجام محاسبات سنگین و دقیق هستند. هدف برخی دیگر افزایش خلاقیت در دنیای دیجیتال است، یا هدف برخی استفاده از تکنولوژی برای بهتر کردن دنیای اطراف و هوشمند سازی کارهای مختلف مانند رانندگی میباشد. در کل این هدف است که پروسه جمع آوری اطلاعات و انتخاب مدل و تکنولوژیها را مشخص میکند.
انواع مختلف AI
هوش مصنوعی بر اساس قابلیت و کارکردی که دارد میتواند به دستههای مختلف تقسیم شود:
هوش مصنوعی ضعیف (Narrow AI):
این هوش مصنوعی برای انجام اقدامات و یا دستورات بسیار خاص تعریف شده است. این دسته از ماشینها برای تسکهای خاص ساخته شدهاند، بنابر این از خود هیچ اختیاری برای انجام کارها و فکر کردن ندارند. تمامی سیستمهای هوش مصنوعی که تا امروز ساخته شدهاند زیر دسته Narrow AI قرار میگیرند. زیر دستههای هوش مصنوعی ضعیف:
- هوش مصنوعی واکنش دهنده (Reactive AI): همان گونه که از نامشان معلوم است، این مدلها فقط به درخواستهای شما واکنش فوری میدهند و از خود عملکردی ندارند و نمیتوانند از تجربیات گذشته خود یاد بگیرند. این ماشینها میتوانند تنها ترکیب محدودی از ورودیها را پاسخ دهند.
- هوش مصنوعی با حافظه محدود (Limited Memory AI): این AI میتواند اطلاعات گذشته را ذخیره کند و از این اطلاعات برای پیش بینی و عمل کردن استفاده کند. هسته این هوش مصنوعی Deep Learning است که عملکرد نورونهای مغز انسان را تقلید میکند. این کارکرد به ماشین اجازه میدهد تا از دادههای گذشته یاد بگیرد و تجربه کسب کند تا اقدامات خود را در طول زمان بهبود بخشد. امروزه از این مدل برای بسیاری از سیستمهای هوش مصنوعی مانند چت باتها و ماشینهای خودران استفاده میشود.
هوش مصنوعی عمومی (Artificial General Intelligence)
این ماشین با نام هوش مصنوعی قوی نیز شناخته میشود. AGI به شکل نظری هوش مصنوعی اشاره دارد که میتواند بیاموزد، فکر کند و طیف وسیعی از وظایف را در سطح انسانی انجام دهد. هدف نهایی AGI ایجاد ماشینهایی است که قادر به انجام کارهای انسانی هستند و میتوانند به عنوان دستیارانی در زندگی روزمره عمل کنند. برای مثال هوش مصنوعی نظریه ذهن (Theory Of Mind) که جز Artificial General Intelligence میباشد به توانایی تشخیص و تفسیر احساسات دیگران اشاره دارد. اصطلاح نظریه ذهن از روانشناسی گرفته شده و توانایی انسان برای خواندن احساسات و پیش بینی پیش آمدهای آینده بر اساس آن را توصیف میکند. یک ماشین با هوش هیجانی میتواند مزایای زیادی برای جهان داشته باشد اما خطرات زیادی نیز با خود همراه دارد. به دلیل ظریف بودن بیش از حد نشانههای احساسی، زمان زیادی طول میکشد که یک ماشین بتواند آنها را درک کند.
ابر هوش مصنوعی (َArtificial Superintelligence)
این دسته بندی به درجهای از هوش مصنوعی اشاره میکند که در هوشمندی، استدلال و درک از انسان پیشی میگیرد. برخلاف Narrow AI، این ماشین به طور کاملا خودآگاه عمل میکند. هوش مصنوعی خودآگاه (Self-Aware AI) مرحلهای فراتر از نظریه ذهن را نشان میدهد و به عنوان یک هدف نهایی در توسعه هوش مصنوعی در نظر گرفته میشود. با ورود Self-Aware AI ماشینهای هوش مصنوعی از کنترل انسان خارج خواهند شد. این مدلها نه تنها میتوانند احساسات دیگران را حس کنند، بلکه احساسات خود را نیز خواهند داشت.
اگر به هوش مصنوعی علاقه دارید…
در پایان
مدلهای هوش مصنوعی به دلیل تفاوت در زیرساختها، جریان دادهها و طراحی و هدفی که دارند متفاوت هستند. این تفاوت در هر مدل، ترکیبی از سخت افزار و انتخابهای انسانی است که در پشت صحنه هرکدام از آنها را منحصر به فرد کرده است.
سوالات متداول
چرا برخی مدلها به توان محاسباتی بیشتری نیاز دارند؟
به دلیل پیچیدگی بالای محاسبات و دادههای زیاد برخی مدلها توان بیشتری برای پردازش نیاز دارند.
کیفیت اطلاعات آموزشی چگونه بر عملکرد AI تاثیر میگذارد؟
دادههای مورد استفاده در یک مدل به طور مستقیم با خروجی آن مدل ارتباط دارند. دادههای خوب، تمیز و پاکسازی شده پایه یک هوش مصنوعی خوب و قوی با کاربرد بالا را میسازند.
آیا یک سخت افزار میتواند انواع مدل AI را آموزش دهد؟
خیر، هر مدلی سخت افزار مورد نیاز و مناسب خود را دارد. برای مثال یک مدل ترانسفورمر یا یک مدل طبقه بندی تصاویر به سخت افزارهای طراحی شده و معماری مخصوص خود نیاز دارند.
منابع
- https://builtin.com/artificial-intelligence/types-of-artificial-intelligence
- https://www.ayadata.ai/what-is-ai-training-data-and-why-it-is-the-basis-of-all-ai-projects/
- https://www.youtube.com/watch?v=XFZ-rQ8eeR8
به این مقاله امتیاز دهید!
میانگین امتیاز 0 / 5. تعداد رأی ها : 0
هنوز هیچ رأیی داده نشده. اولین نفر باشید!
اولین دیدگاه را اضافه کنید.