فرهنگ جامع اصطلاحات هوش مصنوعی؛ تنها راهنمایی که امسال به آن نیاز دارید

هوش مصنوعی در حال بازنویسی جهان است و همزمان، زبان کاملاً جدیدی را برای توصیف نحوه انجام این کار اختراع میکند. این روزها در هر جلسه محصول، ارائه یا پنل گفتگو که بنشینید، خواهید شنید که مردم اصطلاحاتی مانند LLM، RAG، RLHF و دهها واژه دیگر را به زبان میآورند؛ اصطلاحاتی که میتوانند حتی باهوشترین
هوش مصنوعی در حال بازنویسی جهان است و همزمان، زبان کاملاً جدیدی را برای توصیف نحوه انجام این کار اختراع میکند. این روزها در هر جلسه محصول، ارائه یا پنل گفتگو که بنشینید، خواهید شنید که مردم اصطلاحاتی مانند LLM، RAG، RLHF و دهها واژه دیگر را به زبان میآورند؛ اصطلاحاتی که میتوانند حتی باهوشترین افراد دنیای فناوری را هم کمی سردرگم کنند. این واژهنامه تلاش ما برای حل این مشکل است: تعاریف ساده و روان از اصطلاحات هوش مصنوعی که به احتمال زیاد در مسیر ساخت، سرمایهگذاری یا صرفاً برای همگام شدن با اخبار تککرانچ (TechCrunch) و پادکستهای مرتبط با آنها برخورد خواهید کرد. ما این مقاله را با تکامل این حوزه به طور منظم بهروزرسانی میکنیم؛ بنابراین آن را یک سند زنده بدانید، بسیار شبیه به خود سیستمهای هوش مصنوعی که توصیف میکند.
به گزارش مستر دانستنی به نقل از تککرانچ، در ادامه به بررسی مهمترین و کاربردیترین اصطلاحات هوش مصنوعی میپردازیم که هر فعال یا علاقهمند به این حوزه باید با آنها آشنا باشد:
مفهوم هوش مصنوعی عمومی یا AGI چیست؟
اصطلاح هوش مصنوعی عمومی (AGI) یا Artificial General Intelligence واژهای مبهم است. اما به طور کلی به هوش مصنوعی اشاره دارد که در بسیاری از کارها، اگر نه بیشتر آنها، توانمندتر از یک انسان متوسط عمل میکند. سام آلتمن (Sam Altman)، مدیرعامل OpenAI، زمانی AGI را به عنوان «معادل یک انسان متوسط که میتوانید به عنوان همکار استخدام کنید» توصیف کرد. در همین حال، اساسنامه OpenAI این فناوری را به عنوان «سیستمهای بسیار خودمختار که در اقتصادیترین کارهای باارزش، عملکردی بهتر از انسان دارند» تعریف میکند. درک گوگل دیپمایند (Google DeepMind) کمی با این دو تعریف متفاوت است؛ این آزمایشگاه AGI را به عنوان «هوش مصنوعی که حداقل به اندازه انسان در بیشتر وظایف شناختی توانمند است» میبیند. سردرگم شدهاید؟ نگران نباشید؛ متخصصان پیشرو در تحقیقات هوش مصنوعی نیز وضعیت مشابهی دارند!
عامل هوش مصنوعی (AI agent) چیست؟
یک عامل هوش مصنوعی (AI agent) به ابزاری اشاره دارد که از فناوریهای هوش مصنوعی برای انجام یک سری وظایف از طرف شما استفاده میکند؛ کارهایی فراتر از آنچه یک چتبات ساده هوش مصنوعی میتواند انجام دهد، مانند ثبت هزینهها، رزرو بلیط یا میز در رستوران، یا حتی نوشتن و نگهداری کدها. با این حال، همانطور که پیش از این توضیح دادهایم، بخشهای متحرک زیادی در این فضای نوظهور وجود دارد، بنابراین واژه «عامل هوش مصنوعی» ممکن است برای افراد مختلف معانی متفاوتی داشته باشد. زیرساختها نیز هنوز در حال توسعه هستند تا به قابلیتهای پیشبینیشده خود دست یابند. اما مفهوم اساسی آن دلالت بر یک سیستم خودمختار دارد که ممکن است برای انجام وظایف چندمرحلهای از چندین سیستم هوش مصنوعی کمک بگیرد.
نقش نقاط پایانی ایپیآی (API endpoints) در هوش مصنوعی
نقاط پایانی ایپیآی یا API endpoints را مانند «دکمههایی» در پشت یک نرمافزار تصور کنید که برنامههای دیگر میتوانند آنها را فشار دهند تا کارهایی را انجام دهد. توسعهدهندگان از این رابطها برای ایجاد یکپارچهسازی استفاده میکنند؛ به عنوان مثال، به یک اپلیکیشن اجازه میدهند تا دادهها را از اپلیکیشن دیگر استخراج کند، یا به یک عامل هوش مصنوعی امکان میدهند تا خدمات شخص ثالث را مستقیماً بدون نیاز به اپراتور انسانی کنترل کند. بیشتر دستگاههای خانه هوشمند و پلتفرمهای متصل، این دکمههای پنهان را در اختیار دارند، حتی اگر کاربران عادی هرگز آنها را نبینند یا با آنها تعامل نداشته باشند. با تواناتر شدن عاملهای هوش مصنوعی، آنها به طور فزایندهای قادر به یافتن و استفاده از این نقاط پایانی به تنهایی هستند که این امر امکانات قدرتمند و گاهی غیرمنتظرهای را برای اتوماسیون و خودکارسازی باز میکند.
زنجیره تفکر (Chain of thought)؛ راز استدلال مدلهای زبانی
وقتی یک سوال ساده پرسیده میشود، مغز انسان میتواند بدون فکر کردن زیاد به آن پاسخ دهد؛ چیزهایی مثل «کدام حیوان بلندتر است، زرافه یا گربه؟» اما در بسیاری از موارد، شما اغلب به یک قلم و کاغذ نیاز دارید تا به پاسخ صحیح برسید، زیرا مراحل واسطهای وجود دارد. به عنوان مثال، اگر یک کشاورز مرغ و گاو داشته باشد و آنها در مجموع ۴۰ سر و ۱۲۰ پا داشته باشند، ممکن است نیاز داشته باشید یک معادله ساده بنویسید تا به پاسخ برسید (۲۰ مرغ و ۲۰ گاو).
در زمینه هوش مصنوعی، استدلال زنجیره تفکر برای مدلهای زبانی بزرگ به معنای تجزیه یک مسئله به مراحل کوچکتر و میانی برای بهبود کیفیت نتیجه نهایی است. معمولاً رسیدن به پاسخ در این حالت بیشتر طول میکشد، اما پاسخ به احتمال زیاد درست خواهد بود، بهویژه در یک زمینه منطقی یا برنامهنویسی. مدلهای استدلال از مدلهای زبانی بزرگ سنتی توسعه یافتهاند و به لطف یادگیری تعزیزی برای تفکر زنجیره تفکر بهینهسازی شدهاند.
عاملهای برنامهنویسی (Coding agents)؛ همکاران خستگیناپذیر توسعهدهندگان
این یک مفهوم خاصتر از «عامل هوش مصنوعی» است که به برنامهای اشاره دارد که میتواند به طور مستقل و مرحله به مرحله برای تکمیل یک هدف اقدام کند. یک عامل برنامهنویسی (Coding agent) نسخه تخصصی است که در توسعه نرمافزار کاربرد دارد. به جای اینکه صرفاً کدی را برای بررسی و چسباندن توسط انسان پیشنهاد کند، یک عامل برنامهنویسی میتواند به طور خودکار کد بنویسد، آن را آزمایش کند و باگزدایی (Debug) نماید؛ یعنی انجام همان کارهای تکراری و مبتنی بر آزمون و خطایی که معمولاً وقت روزانه یک توسعهدهنده را میگیرد. این عاملها میتوانند در کل پایگاههای کد (Codebases) فعالیت کنند، باگها را شناسایی کنند، تستها را اجرا نمایند و با حداقل نظارت انسانی اصلاحات را اعمال کنند. این کار شبیه استخدام یک کارآموز بسیار سریع است که هرگز نمیخوابد و هرگز تمرکز خود را از دست نمیدهد؛ اگرچه مانند هر کارآموزی، یک انسان هنوز باید کار را بازبینی کند.
مفهوم پردازش یا کامپیوت (Compute) در هوش مصنوعی
اگرچه این واژه تا حدودی چندوجهی است، اما پردازش (Compute) به طور کلی به قدرت محاسباتی حیاتی اشاره دارد که به مدلهای هوش مصنوعی اجازه فعالیت میدهد. این نوع پردازش سوخت صنعت هوش مصنوعی است و به آن توانایی آموزش و استقرار مدلهای قدرتمندش را میدهد. این اصطلاح اغلب یک نام اختصاری برای انواع سختافزارهایی است که قدرت محاسباتی را فراهم میکنند؛ چیزهایی مانند پردازنده گرافیکی (GPU)، پردازنده مرکزی (CPU)، واحد پردازش تنسور (TPU) و اشکال دیگر زیرساخت که سنگ بنای صنعت هوش مصنوعی مدرن را تشکیل میدهند.
یادگیری عمیق (Deep learning) چیست؟
زیرمجموعهای از یادگیری ماشین خودبهبوددهنده است که در آن الگوریتمهای هوش مصنوعی با ساختار شبکه عصبی مصنوعی (ANN) چندلایه طراحی میشوند. این ساختار به آنها اجازه میدهد تا در مقایسه با سیستمهای سادهتر مبتنی بر یادگیری ماشین، مانند مدلهای خطی یا درختهای تصمیم، همبستگیهای پیچیدهتری ایجاد کنند. ساختار الگوریتمهای یادگیری عمیق (Deep learning) از مسیرهای متصل به هم نورونها در مغز انسان الهام گرفته شده است.
مدلهای هوش مصنوعی یادگیری عمیق قادر به شناسایی ویژگیهای مهم در خود دادهها هستند، به جای اینکه مهندسان انسانی نیاز به تعریف این ویژگیها داشته باشند. این ساختار همچنین از الگوریتمهایی پشتیبانی میکند که میتوانند از خطاها درس بگیرند و از طریق فرآیند تکرار و تنظیم، خروجیهای خود را بهبود بخشند. با این حال، سیستمهای یادگیری عمیق برای ایجاد نتایج خوب به نقاط داده بسیار زیادی (میلیونها یا بیشتر) نیاز دارند. آنها همچنین معمولاً در مقایسه با الگوریتمهای یادگیری ماشین سادهتر، زمان بیشتری برای آموزش نیاز دارند؛ بنابراین هزینههای توسعه آنها بالاتر است.
تکنولوژی دیفیوژن یا نفوذ (Diffusion) در تولید محتوا
فناوری دیفیوژن یا نفوذ (Diffusion) هسته اصلی بسیاری از مدلهای هوش مصنوعی تولیدکننده هنر، موسیقی و متن است. با الهام از علم فیزیک، سیستمهای دیفیوژن به آرامی ساختار دادهها (به عنوان مثال، عکسها، آهنگها و غیره) را با افزودن نویز تخریب میکنند تا زمانی که چیزی باقی نماند. در فیزیک، نفوذ خودبهخودی و برگشتناپذیر است؛ شکر پخششده در قهوه را نمیتوان به شکل مکعب بازگرداند. اما سیستمهای دیفیوژن در هوش مصنوعی هدفشان یادگیری نوعی فرآیند «نفوذ معکوس» برای بازیابی دادههای تخریبشده است تا توانایی بازسازی دادهها از روی نویز را به دست آورند.
تقطیر مدل یا دیستلیشن (Distillation) چیست؟
تکنیک تقطیر مدل (Distillation) روشی است که برای استخراج دانش از یک مدل بزرگ هوش مصنوعی با استفاده از مدل «معلم-شاگرد» استفاده میشود. توسعهدهندگان درخواستها را به یک مدل معلم ارسال کرده و خروجیها را ثبت میکنند. پاسخها گاهی اوقات با یک مجموعه داده مقایسه میشوند تا میزان دقت آنها سنجیده شود. سپس از این خروجیها برای آموزش مدل شاگرد استفاده میشود که آموزش دیده است تا رفتاری شبیه به معلم داشته باشد.
از تقطیر میتوان برای ایجاد یک مدل کوچکتر و کارآمدتر بر اساس یک مدل بزرگتر با حداقل کاهش کیفیت استفاده کرد. این احتمالا همان روشی است که OpenAI برای توسعه GPT-4 Turbo، نسخه سریعتر GPT-4، از آن استفاده کرده است. در حالی که همه شرکتهای هوش مصنوعی از تقطیر به صورت داخلی استفاده میکنند، ممکن است توسط برخی از شرکتها برای رسیدن به مدلهای پیشرو نیز استفاده شده باشد. تقطیر از مدل یک رقیب معمولاً شرایط استفاده از خدمات API و دستیارهای چت هوش مصنوعی را نقض میکند.
مفهوم واژه فین تیونینگ یا تنظیم دقیق (Fine-tuning)
این اصطلاح به آموزش بیشتر یک مدل هوش مصنوعی برای بهینهسازی عملکرد در یک وظیفه یا حوزه خاصتر از آنچه قبلاً تمرکز اصلی آموزش آن بوده است، اشاره دارد؛ این کار معمولاً با تزریق دادههای جدید و تخصصی (یعنی هدفمند) انجام میشود. بسیاری از استارتاپهای هوش مصنوعی، مدلهای زبانی بزرگ را به عنوان نقطه شروع برای ساخت یک محصول تجاری در نظر میگیرند، اما تلاش میکنند تا با تکمیل چرخههای آموزشی قبلی از طریق تنظیم دقیق (Fine-tuning) بر اساس دانش و تخصص خاص دامنه خود، کاربرد آن را برای یک بخش یا وظیفه هدف افزایش دهند.
شبکه مولد رقابتی یا گن (GAN) چیست؟
یک GAN یا Generative Adversarial Network (شبکه مولد رقابتی)، نوعی چارچوب یادگیری ماشین است که زیربنای برخی از پیشرفتهای مهم در هوش مصنوعی مولد هنگام تولید دادههای واقعی، از جمله (اما نه محدود به) ابزارهای دیپفیک (Deepfake) است. شبکههای GAN شامل استفاده از یک جفت شبکه عصبی هستند که یکی از آنها از دادههای آموزشی خود برای تولید خروجی استفاده میکند و این خروجی برای ارزیابی به مدل دیگر فرستاده میشود.
این دو مدل اساساً طوری برنامهریزی شدهاند که سعی کنند از یکدیگر پیشی بگیرند. مدل مولد (Generator) تلاش میکند خروجی خود را از مدل تشخیصدهنده (Discriminator) عبور دهد، در حالی که متمایزکننده در تلاش است دادههای تولیدشده مصنوعی را شناسایی کند. این رقابت ساختاریافته میتواند خروجیهای هوش مصنوعی را بدون نیاز به مداخله انسانی بیشتر، واقعیتر کند. اگرچه شبکههای GAN برای کاربردهای محدودتر (مانند تولید عکسها یا ویدیوهای واقعی) بهتر عمل میکنند تا هوش مصنوعی با اهداف عمومی.
توهم هوش مصنوعی (Hallucination) چیست؟
واژه توهم هوش مصنوعی (Hallucination) اصطلاح ترجیحی این صنعت برای زمانی است که مدلهای هوش مصنوعی اطلاعات نادرست سر هم میکنند؛ یعنی به معنای واقعی کلمه اطلاعات غلط تولید میکنند. بدیهی است که این یک مشکل بزرگ برای کیفیت هوش مصنوعی است. توهمها خروجیهایی را در هوش مصنوعی مولد تولید میکنند که میتوانند گمراهکننده باشند و حتی منجر به خطرات واقعی در زندگی شوند که پیامدهای بالقوه خطرناکی دارد (مثلاً یک پرسش سلامتی که توصیههای پزشکی مضری را بازمیگرداند).
تصور میشود مشکل جعل اطلاعات توسط هوش مصنوعی ناشی از شکافها در دادههای آموزشی باشد. توهمها به سوق دادن صنعت به سمت مدلهای هوش مصنوعی فزاینده تخصصی و عمودی (Vertical) کمک میکنند؛ یعنی هوش مصنوعیهای خاص دامنه که به تخصص محدودتری نیاز دارند تا احتمال شکافهای دانش و خطرات اطلاعات نادرست کاهش یابد.
فرآیند استنتاج یا اینفرنس (Inference) در هوش مصنوعی
اصطلاح استنتاج (Inference) فرآیند اجرای یک مدل هوش مصنوعی است. این فرآیند به معنای رها کردن یک مدل برای پیشبینی یا نتیجهگیری از دادههایی است که قبلاً دیده شده است. برای شفافیت بیشتر، استنتاج بدون آموزش نمیتواند اتفاق بیفتد؛ یک مدل باید الگوها را در مجموعهای از دادهها بیاموزد تا بتواند به طور مؤثر از این دادههای آموزشی استخراج و پیشبینی کند.
بسیاری از انواع سختافزارها میتوانند استنتاج را انجام دهند، از پردازندههای گوشیهای هوشمند گرفته تا پردازندههای گرافیکی قدرتمند و شتابدهندههای هوش مصنوعی با طراحی اختصاصی. اما همه آنها نمیتوانند مدلها را به یک اندازه خوب اجرا کنند. پیشبینی مدلهای بسیار بزرگ در مقایسه با سرور ابری مجهز به تراشههای هوش مصنوعی ردهبالا، روی لپتاپ زمان بسیار زیادی طول میکشد.
مدل زبانی بزرگ (LLM) چیست؟
اصطلاح مدلهای زبانی بزرگ (LLM) یا Large Language Models، مدلهای هوش مصنوعی هستند که توسط دستیارهای محبوب هوش مصنوعی مانند ChatGPT، کلود (Claude)، جمینای گوگل، لاما متعلق به متا، مایکروسافت کوپایلت یا لوشات میسترال استفاده میشوند. وقتی با یک دستیار هوش مصنوعی چت میکنید، با یک مدل زبانی بزرگ تعامل دارید که درخواست شما را به طور مستقیم یا با کمک ابزارهای مختلف در دسترس مانند مرور وب یا مفسرهای کد پردازش میکند.
مدلهای LLM شبکههای عصبی عمیقی هستند که از میلیاردها پارامتر عددی (یا وزنها) تشکیل شدهاند که روابط بین کلمات و عبارات را یاد میگیرند و یک نمایش از زبان، یعنی نوعی نقشه چندبعدی از کلمات را ایجاد میکنند. این مدلها از کدگذاری الگوهایی که در میلیاردها کتاب، مقاله و رونوشت پیدا میکنند، ایجاد میشوند. وقتی به یک LLM دستور میدهید، مدل محتملترین الگویی را که با دستور همخوانی دارد، تولید میکند.
کش حافظه (Memory cache) و بهینهسازی سرعت خروجی
مفهوم کش حافظه (Memory cache) به فرآیند مهمی اشاره دارد که استنتاج را تقویت میکند. در اصل، حافظه پنهان یک تکنیک بهینهسازی است که برای کارآمدتر کردن فرآیند استنتاج طراحی شده است. هوش مصنوعی به وضوح توسط محاسبات ریاضی با پتانسیل بالا هدایت میشود و هر بار که آن محاسبات انجام میشوند، انرژی بیشتری مصرف میکنند. حافظه پنهان برای کاهش تعداد محاسباتی که یک مدل ممکن است مجبور به اجرا باشد، با ذخیره محاسبات خاص برای درخواستها و عملیاتهای بعدی کاربر طراحی شده است. انواع مختلفی از حافظه پنهان وجود دارد، اگرچه یکی از شناختهشدهترین آنها KV caching (کلید-مقدار) است. این قابلیت در مدلهای مبتنی بر ترانسفورمر کار میکند و کارایی را افزایش میدهد و با کاهش زمان تولید پاسخ، نتایج سریعتری را به همراه دارد.
پروتکل کانتکست مدل یا امسیپی (Model Context Protocol)
پروتکل کانتکست مدل یا Model Context Protocol (MCP)، یک استاندارد باز است که به مدلهای هوش مصنوعی اجازه میدهد به ابزارها و دادههای خارجی (فایلها، پایگاههای داده یا برنامههایی مانند اسلک و گوگل درایو) متصل شوند، بدون اینکه توسعهدهنده برای هر اتصال یک رابط اختصاصی بسازد. آن را مانند یک پورت USB-C برای هوش مصنوعی تصور کنید. شرکت آنتروپیک (Anthropic) پروتکل MCP را در سال ۲۰۲۴ معرفی کرد و بعداً آن را به بنیاد لینوکس سپرد و از آن زمان توسط گوگل، مایکروسافت و OpenAI پذیرفته شده است و آن را به یکی از سریعترین استانداردهای در حال گسترش در تاریخ اخیر هوش مصنوعی تبدیل کرده است.
معماری ترکیب کارشناسان یا اماوئی (Mixture of Experts)
ساختار ترکیب کارشناسان (Mixture of Experts) یا MoE یک معماری مدل است که یک شبکه عصبی را به چندین شبکه فرعی تخصصی کوچکتر یا «کارشناس» تقسیم میکند و تنها تعداد کمی از آنها را برای هر وظیفه مشخص فعال میسازد. به جای هدایت هر درخواست از طریق کل مدل، یک مدل MoE دارای یک «روتر» داخلی است که دقیقاً متخصصان مناسب را برای آن کار انتخاب میکند. این امر ساخت مدلهای عظیمی را امکانپذیر میکند که نسبتاً سریع و ارزان اجرا میشوند، زیرا در هر زمان تنها بخشی از شبکه در حال انجام کار است. مدل Mixtral از شرکت Mistral AI یک نمونه معروف است؛ همچنین به طور گستردهای باور بر این است که مدلهای جدیدتر GPT شرکت OpenAI نیز از نسخهای از این رویکرد استفاده میکنند، اگرچه این شرکت هرگز آن را به طور رسمی تایید نکرده است.
شبکه عصبی (Neural network) چیست؟
یک شبکه عصبی (Neural network) به ساختار الگوریتمی چندلایه اشاره دارد که زیربنای یادگیری عمیق و به طور گستردهتر، کل رونق ابزارهای هوش مصنوعی مولد به دنبال ظهور مدلهای زبانی بزرگ است. اگرچه ایده الهام گرفتن از مسیرهای متراکم متصل به هم در مغز انسان به عنوان یک ساختار طراحی برای الگوریتمهای پردازش داده به دهه ۱۹۴۰ بازمیگردد، اما ظهور بسیار جدیدتر سختافزارهای پردازش گرافیکی (GPUs) از طریق صنعت بازیهای ویدیویی بود که واقعاً قدرت این نظریه را آزاد کرد. این تراشهها برای آموزش الگوریتمهایی با لایههای بسیار بیشتر از آنچه در دورههای گذشته ممکن بود، مناسب بودند و سیستمهای هوش مصنوعی مبتنی بر شبکه عصبی را قادر ساختند تا در بسیاری از حوزهها از جمله تشخیص صدا، ناوبری خودکار و کشف دارو به عملکرد بسیار بهتری دست یابند.
مفهوم متنباز (Open source) در دنیای هوش مصنوعی
اصطلاح متنباز (Open source) به نرمافزار یا به طور فزایندهای به مدلهای هوش مصنوعی اشاره دارد که در آنها کد زیربنایی برای استفاده، بررسی یا اصلاح در اختیار عموم قرار میگیرد. در دنیای هوش مصنوعی، خانواده مدلهای لاما (Lama) متعلق به شرکت متا یک نمونه برجسته است. رویکردهای متنباز به محققان، توسعهدهندگان و شرکتها در سراسر جهان اجازه میدهد تا بر روی کار یکدیگر پلتفرمهای جدید بسازند، پیشرفت را تسریع کنند و ممیزیهای ایمنی مستقلی را فعال کنند که سیستمهای بسته به راحتی نمیتوانند ارائه دهند. منبع بسته (Closed source) به این معنی است که کد خصوصی است؛ شما میتوانید از محصول استفاده کنید اما نمیتوانید نحوه کار آن را ببینید، همانطور که در مورد مدلهای GPT شرکت OpenAI صدق میکند؛ تمایزی که به یکی از بحثهای تعیینکننده در صنعت هوش مصنوعی تبدیل شده است.
موازیسازی (Parallelization) چیست؟
اصطلاح موازیسازی (Parallelization) به معنای انجام کارهای زیادی به طور همزمان به جای انجام آنها یکی پس از دیگری است. در هوش مصنوعی، موازیسازی هم برای آموزش و هم برای استنتاج بنیادی است: پردازندههای گرافیکی مدرن بهطور خاص برای انجام هزاران محاسبه به صورت موازی طراحی شدهاند، که دلیل بزرگی برای تبدیل شدن آنها به ستون فقرات سختافزاری این صنعت است. با پیچیدهتر شدن سیستمهای هوش مصنوعی و بزرگتر شدن مدلها، توانایی موازیسازی کارها در میان تراشهها و ماشینهای متعدد به یکی از مهمترین عوامل در تعیین سرعت و صرفه اقتصادی ساخت و استقرار مدلها تبدیل شده است. تحقیق در مورد استراتژیهای موازیسازی بهتر اکنون به خودی خود یک رشته مطالعاتی است.
بحران رم یا رمآگدون (RAMageddon)؛ چالش جدید سختافزار
واژه RAMageddon اصطلاح جدید و جذابی برای یک روند نهچندان جذاب است که صنعت فناوری را در بر گرفته است: کمبود فزاینده حافظه دسترسی تصادفی یا تراشههای RAM که تقریباً تمام محصولات فناوری را که در زندگی روزمره خود استفاده میکنیم، تغذیه میکنند. با شکوفایی صنعت هوش مصنوعی، بزرگترین شرکتهای فناوری و آزمایشگاههای هوش مصنوعی که همگی برای داشتن قدرتمندترین و کارآمدترین هوش مصنوعی رقابت میکنند، آنقدر رم برای تامین انرژی مراکز داده خود میخرند که چیز زیادی برای بقیه ما باقی نمیماند و این گلوگاه عرضه به این معنی است که آنچه باقی مانده گرانتر و گرانتر میشود.
این شامل صنایعی مانند بازیهای ویدیویی (جایی که شرکتهای بزرگ مجبور شدهاند قیمت کنسولها را افزایش دهند زیرا پیدا کردن تراشههای حافظه برای دستگاههایشان سختتر است)، لوازم الکترونیکی مصرفی (جایی که کمبود حافظه میتواند باعث بزرگترین کاهش در عرضه گوشیهای هوشمند در بیش از یک دهه اخیر شود) و محاسبات سازمانی عمومی میشود. انتظار میرود افزایش قیمتها تنها پس از پایان این کمبود وحشتناک متوقف شود، اما متأسفانه، واقعاً نشانه چندانی وجود ندارد که این اتفاق به این زودیها رخ دهد.
خودبهبوددهی بازگشتی (Recursive self-improvement)
مانند AGI، خودبهبوددهی بازگشتی (RSI) آستانهای است برای اینکه هوش مصنوعی چقدر میتواند هوشمند شود و چقدر کم میتواند به انسان متکی باشد. در سناریوی RSI، مدلهای هوش مصنوعی شروع به بهبود خود بدون مداخله انسانی میکنند که منجر به شتاب عظیمی در قابلیتها و خودمختاری میشود. در برخی روایتها، این یک لحظه فاجعهبار شبیه به تکینگی (Singularity) خواهد بود؛ لحظهای که مدلهای هوش مصنوعی در برابر مداخله خارجی مصون میشوند. اما RSI یک قابلیت اساسی را نیز توصیف میکند؛ آیا یک مدل هوش مصنوعی میتواند جانشین خود را طراحی کند؟ تعدادی از استارتاپهای اخیر هوش مصنوعی برای ساخت مدلهای خودبهبوددهنده بازگشتی آستین بالا زدهاند، اما بیشتر آنها پیامدهای آخرالزمانی را رد میکنند و RSI را صرفاً به عنوان مرز بعدی برای تحقیقات معرفی مینمایند.
یادگیری تقویتی (Reinforcement learning)؛ آموزش با پاداش و تنبیه
روش یادگیری تقویتی (Reinforcement learning) راهی برای آموزش هوش مصنوعی است که در آن یک سیستم با امتحان کردن چیزها و دریافت پاداش برای پاسخهای صحیح یاد میگیرد؛ مانند آموزش دادن به حیوان خانگی خود با تشویقی، با این تفاوت که حیوان خانگی در این سناریو یک شبکه عصبی است و تشویقی یک سیگنال ریاضی است که نشاندهنده موفقیت است. برخلاف یادگیری نظارتشده (Supervised learning) که در آن مدل روی یک مجموعه داده ثابت از نمونههای برچسبگذاری شده آموزش میبیند، یادگیری تقویتی به مدل اجازه میدهد تا محیط خود را کشف کند، اقداماتی انجام دهد و به طور مداوم رفتار خود را بر اساس بازخوردی که دریافت میکند بهروزرسانی نماید. تکنیکهایی مانند یادگیری تقویتی از بازخورد انسانی یا RLHF اکنون برای نحوه تنظیم دقیق مدلهای آزمایشگاههای پیشرو هوش مصنوعی جهت مفیدتر، دقیقتر و ایمنتر بودن آنها محوری هستند.
توکن (Token)؛ واحدهای ساختاری درک هوش مصنوعی
وقتی صحبت از ارتباط انسان و ماشین به میان میآید، چالشهای آشکاری وجود دارد؛ انسانها با استفاده از زبان انسانی ارتباط برقرار میکنند، در حالی که برنامههای هوش مصنوعی وظایف را از طریق فرآیندهای الگوریتمی پیچیده مطلع از دادهها اجرا مینمایند. توکنها (Tokens) این شکاف را پر میکنند: آنها بلوکهای ساختمانی اساسی ارتباط انسان و هوش مصنوعی هستند که بخشهای مجزایی از دادهها را نشان میدهند که توسط یک LLM پردازش یا تولید شدهاند. آنها از طریق فرآیندی به نام توکنایزیشن (Tokenization) ایجاد میشوند که متن خام را به واحدهای کوچک قابل هضم برای یک مدل زبانی تجزیه میکند. در محیطهای سازمانی، توکنها هزینه را نیز تعیین میکنند؛ بیشتر شرکتهای هوش مصنوعی برای استفاده از LLM بر اساس هر توکن هزینه دریافت میکنند، به این معنی که هر چه یک کسبوکار بیشتر استفاده کند، هزینه بیشتری پرداخت مینماید.
نرخ پردازش توکن (Token throughput) چیست؟
توکنها تکههای کوچکی از متن هستند (اغلب بخشهایی از کلمات به جای کلمات کامل) که مدلهای زبانی هوش مصنوعی زبان را قبل از پردازش به آنها تجزیه میکنند. نرخ پردازش یا Throughput به این اشاره دارد که چه مقدار میتواند در یک دوره زمانی معین پردازش شود، بنابراین نرخ پردازش توکن اساساً معیاری است برای اینکه یک سیستم چه مقدار کار هوش مصنوعی را میتواند در یک زمان انجام دهد. نرخ پردازش توکن بالا یک هدف کلیدی برای تیمهای زیرساخت هوش مصنوعی است، زیرا تعیین میکند که یک مدل چه تعداد کاربر را میتواند به طور همزمان سرویسدهی کند و هر یک از آنها با چه سرعتی پاسخ دریافت مینمایند.
مفهوم آموزش یا ترینینگ (Training) در هوش مصنوعی
توسعه هوش مصنوعیهای یادگیری ماشین شامل فرآیندی است که به عنوان آموزش (Training) شناخته میشود. به زبان ساده، این امر به دادههایی اشاره دارد که به منظور یادگیری مدل از الگوها و تولید خروجیهای مفید، به سیستم تزریق میشوند. فرآیند آموزش میتواند گران باشد زیرا به ورودیهای زیادی نیاز دارد و حجمهای مورد نیاز رو به افزایش بوده است؛ به همین دلیل است که رویکردهای ترکیبی، مانند تنظیم دقیق یک هوش مصنوعی مبتنی بر قانون با دادههای هدفمند، میتوانند به مدیریت هزینهها بدون شروع کامل از صفر کمک کنند.
یادگیری انتقالی (Transfer learning) چیست؟
تکنیکی که در آن یک مدل هوش مصنوعی از قبل آموزش دیده به عنوان نقطه شروع برای توسعه یک مدل جدید برای یک وظیفه متفاوت اما معمولاً مرتبط استفاده میشود؛ این کار اجازه میدهد تا دانش کسبشده در چرخههای آموزشی قبلی دوباره اعمال شود. یادگیری انتقالی (Transfer learning) میتواند با ایجاد میانبر در توسعه مدل، صرفهجویی در هزینه و افزایش کارایی را به همراه داشته باشد. همچنین زمانی که دادهها برای وظیفهای که مدل برای آن توسعه مییابد تا حدودی محدود است، میتواند مفید باشد. اما توجه به این نکته مهم است که این رویکرد محدودیتهایی دارد و مدلها برای عملکرد خوب در حوزه تمرکز خود، احتمالاً به آموزش روی دادههای اضافی نیاز خواهند داشت.
خطای اعتبارسنجی (Validation loss) چیست؟
اصطلاح خطای اعتبارسنجی (Validation loss) عددی است که به شما میگوید یک مدل هوش مصنوعی در طول آموزش چقدر خوب یاد میگیرد و هر چه کمتر باشد بهتر است. محققان آن را از نزدیک به عنوان نوعی کارنامه زمان واقعی ردیابی میکنند و از آن برای تصمیمگیری در مورد زمان توقف آموزش یا تنظیم هایپرپارامترها استفاده مینمایند. یکی از نگرانیهای کلیدی که به پرچمگذاری آن کمک میکند، بیشبرازش (Overfitting) است؛ وضعیتی که در آن یک مدل دادههای آموزشی خود را به جای یادگیری واقعی الگوهایی که بتواند در موقعیتهای جدید تعمیم دهد، حفظ میکند.
وزنها (Weights) در مدلهای هوش مصنوعی
اصطلاح وزنها (Weights) برای آموزش هوش مصنوعی محوری هستند، زیرا تعیین میکنند چقدر اهمیت (یا وزن) به ویژگیهای مختلف (یا متغیرهای ورودی) در دادههای مورد استفاده برای آموزش سیستم داده شود و از این طریق خروجی مدل هوش مصنوعی را شکل میدهند. به عبارت دیگر، وزنها پارامترهای عددی هستند که تعیین میکنند چه چیزی در یک مجموعه داده برای وظیفه آموزشی دادهشده مهمتر است. آموزش مدل معمولاً با وزنهایی شروع میشود که به طور تصادفی اختصاص داده شدهاند، اما با پیشرفت فرآیند، وزنها تنظیم میشوند زیرا مدل به دنبال رسیدن به خروجی است که به هدف نزدیکتر باشد.
برچسب ها :
ناموجود- نظرات ارسال شده توسط شما، پس از تایید توسط مدیران سایت منتشر خواهد شد.
- نظراتی که حاوی تهمت یا افترا باشد منتشر نخواهد شد.
- نظراتی که به غیر از زبان فارسی یا غیر مرتبط با خبر باشد منتشر نخواهد شد.






ارسال نظر شما
مجموع نظرات : 0 در انتظار بررسی : 0 انتشار یافته : 0