تاریخ انتشار : شنبه 4 جولای 2026 - 14:41

2 بازدید

کد خبر : 10968

فرهنگ جامع اصطلاحات هوش مصنوعی؛ تنها راهنمایی که امسال به آن نیاز دارید

هوش مصنوعی در حال بازنویسی جهان است و هم‌زمان، زبان کاملاً جدیدی را برای توصیف نحوه انجام این کار اختراع می‌کند. این روزها در هر جلسه محصول، ارائه یا پنل گفتگو که بنشینید، خواهید شنید که مردم اصطلاحاتی مانند LLM، RAG، RLHF و ده‌ها واژه دیگر را به زبان می‌آورند؛ اصطلاحاتی که می‌توانند حتی باهوش‌ترین افراد دنیای فناوری را هم کمی سردرگم کنند. این واژه‌نامه تلاش ما برای حل این مشکل است: تعاریف ساده و روان از اصطلاحات هوش مصنوعی که به احتمال زیاد در مسیر ساخت، سرمایه‌گذاری یا صرفاً برای همگام شدن با اخبار تک‌کرانچ (TechCrunch) و پادکست‌های مرتبط با آن‌ها برخورد خواهید کرد. ما این مقاله را با تکامل این حوزه به طور منظم به‌روزرسانی می‌کنیم؛ بنابراین آن را یک سند زنده بدانید، بسیار شبیه به خود سیستم‌های هوش مصنوعی که توصیف می‌کند.

به گزارش مستر دانستنی به نقل از تک‌کرانچ، در ادامه به بررسی مهم‌ترین و کاربردی‌ترین اصطلاحات هوش مصنوعی می‌پردازیم که هر فعال یا علاقه‌مند به این حوزه باید با آن‌ها آشنا باشد:

مفهوم هوش مصنوعی عمومی یا AGI چیست؟

اصطلاح هوش مصنوعی عمومی (AGI) یا Artificial General Intelligence واژه‌ای مبهم است. اما به طور کلی به هوش مصنوعی اشاره دارد که در بسیاری از کارها، اگر نه بیشتر آن‌ها، توانمندتر از یک انسان متوسط عمل می‌کند. سام آلتمن (Sam Altman)، مدیرعامل OpenAI، زمانی AGI را به عنوان «معادل یک انسان متوسط که می‌توانید به عنوان همکار استخدام کنید» توصیف کرد. در همین حال، اساسنامه OpenAI این فناوری را به عنوان «سیستم‌های بسیار خودمختار که در اقتصادی‌ترین کارهای باارزش، عملکردی بهتر از انسان دارند» تعریف می‌کند. درک گوگل دیپ‌مایند (Google DeepMind) کمی با این دو تعریف متفاوت است؛ این آزمایشگاه AGI را به عنوان «هوش مصنوعی که حداقل به اندازه انسان در بیشتر وظایف شناختی توانمند است» می‌بیند. سردرگم شده‌اید؟ نگران نباشید؛ متخصصان پیشرو در تحقیقات هوش مصنوعی نیز وضعیت مشابهی دارند!

عامل هوش مصنوعی (AI agent) چیست؟

یک عامل هوش مصنوعی (AI agent) به ابزاری اشاره دارد که از فناوری‌های هوش مصنوعی برای انجام یک سری وظایف از طرف شما استفاده می‌کند؛ کارهایی فراتر از آنچه یک چت‌بات ساده هوش مصنوعی می‌تواند انجام دهد، مانند ثبت هزینه‌ها، رزرو بلیط یا میز در رستوران، یا حتی نوشتن و نگهداری کدها. با این حال، همان‌طور که پیش از این توضیح داده‌ایم، بخش‌های متحرک زیادی در این فضای نوظهور وجود دارد، بنابراین واژه «عامل هوش مصنوعی» ممکن است برای افراد مختلف معانی متفاوتی داشته باشد. زیرساخت‌ها نیز هنوز در حال توسعه هستند تا به قابلیت‌های پیش‌بینی‌شده خود دست یابند. اما مفهوم اساسی آن دلالت بر یک سیستم خودمختار دارد که ممکن است برای انجام وظایف چندمرحله‌ای از چندین سیستم هوش مصنوعی کمک بگیرد.

نقش نقاط پایانی ای‌پی‌آی (API endpoints) در هوش مصنوعی

نقاط پایانی ای‌پی‌آی یا API endpoints را مانند «دکمه‌هایی» در پشت یک نرم‌افزار تصور کنید که برنامه‌های دیگر می‌توانند آن‌ها را فشار دهند تا کارهایی را انجام دهد. توسعه‌دهندگان از این رابط‌ها برای ایجاد یکپارچه‌سازی استفاده می‌کنند؛ به عنوان مثال، به یک اپلیکیشن اجازه می‌دهند تا داده‌ها را از اپلیکیشن دیگر استخراج کند، یا به یک عامل هوش مصنوعی امکان می‌دهند تا خدمات شخص ثالث را مستقیماً بدون نیاز به اپراتور انسانی کنترل کند. بیشتر دستگاه‌های خانه هوشمند و پلتفرم‌های متصل، این دکمه‌های پنهان را در اختیار دارند، حتی اگر کاربران عادی هرگز آن‌ها را نبینند یا با آن‌ها تعامل نداشته باشند. با تواناتر شدن عامل‌های هوش مصنوعی، آن‌ها به طور فزاینده‌ای قادر به یافتن و استفاده از این نقاط پایانی به تنهایی هستند که این امر امکانات قدرتمند و گاهی غیرمنتظره‌ای را برای اتوماسیون و خودکارسازی باز می‌کند.

زنجیره تفکر (Chain of thought)؛ راز استدلال مدل‌های زبانی

وقتی یک سوال ساده پرسیده می‌شود، مغز انسان می‌تواند بدون فکر کردن زیاد به آن پاسخ دهد؛ چیزهایی مثل «کدام حیوان بلندتر است، زرافه یا گربه؟» اما در بسیاری از موارد، شما اغلب به یک قلم و کاغذ نیاز دارید تا به پاسخ صحیح برسید، زیرا مراحل واسطه‌ای وجود دارد. به عنوان مثال، اگر یک کشاورز مرغ و گاو داشته باشد و آن‌ها در مجموع ۴۰ سر و ۱۲۰ پا داشته باشند، ممکن است نیاز داشته باشید یک معادله ساده بنویسید تا به پاسخ برسید (۲۰ مرغ و ۲۰ گاو).

در زمینه هوش مصنوعی، استدلال زنجیره تفکر برای مدل‌های زبانی بزرگ به معنای تجزیه یک مسئله به مراحل کوچک‌تر و میانی برای بهبود کیفیت نتیجه نهایی است. معمولاً رسیدن به پاسخ در این حالت بیشتر طول می‌کشد، اما پاسخ به احتمال زیاد درست خواهد بود، به‌ویژه در یک زمینه منطقی یا برنامه‌نویسی. مدل‌های استدلال از مدل‌های زبانی بزرگ سنتی توسعه یافته‌اند و به لطف یادگیری تعزیزی برای تفکر زنجیره تفکر بهینه‌سازی شده‌اند.

عامل‌های برنامه‌نویسی (Coding agents)؛ همکاران خستگی‌ناپذیر توسعه‌دهندگان

این یک مفهوم خاص‌تر از «عامل هوش مصنوعی» است که به برنامه‌ای اشاره دارد که می‌تواند به طور مستقل و مرحله به مرحله برای تکمیل یک هدف اقدام کند. یک عامل برنامه‌نویسی (Coding agent) نسخه تخصصی است که در توسعه نرم‌افزار کاربرد دارد. به جای اینکه صرفاً کدی را برای بررسی و چسباندن توسط انسان پیشنهاد کند، یک عامل برنامه‌نویسی می‌تواند به طور خودکار کد بنویسد، آن را آزمایش کند و باگ‌زدایی (Debug) نماید؛ یعنی انجام همان کارهای تکراری و مبتنی بر آزمون و خطایی که معمولاً وقت روزانه یک توسعه‌دهنده را می‌گیرد. این عامل‌ها می‌توانند در کل پایگاه‌های کد (Codebases) فعالیت کنند، باگ‌ها را شناسایی کنند، تست‌ها را اجرا نمایند و با حداقل نظارت انسانی اصلاحات را اعمال کنند. این کار شبیه استخدام یک کارآموز بسیار سریع است که هرگز نمی‌خوابد و هرگز تمرکز خود را از دست نمی‌دهد؛ اگرچه مانند هر کارآموزی، یک انسان هنوز باید کار را بازبینی کند.

مفهوم پردازش یا کامپیوت (Compute) در هوش مصنوعی

اگرچه این واژه تا حدودی چندوجهی است، اما پردازش (Compute) به طور کلی به قدرت محاسباتی حیاتی اشاره دارد که به مدل‌های هوش مصنوعی اجازه فعالیت می‌دهد. این نوع پردازش سوخت صنعت هوش مصنوعی است و به آن توانایی آموزش و استقرار مدل‌های قدرتمندش را می‌دهد. این اصطلاح اغلب یک نام اختصاری برای انواع سخت‌افزارهایی است که قدرت محاسباتی را فراهم می‌کنند؛ چیزهایی مانند پردازنده گرافیکی (GPU)، پردازنده مرکزی (CPU)، واحد پردازش تنسور (TPU) و اشکال دیگر زیرساخت که سنگ بنای صنعت هوش مصنوعی مدرن را تشکیل می‌دهند.

یادگیری عمیق (Deep learning) چیست؟

زیرمجموعه‌ای از یادگیری ماشین خود‌بهبوددهنده است که در آن الگوریتم‌های هوش مصنوعی با ساختار شبکه عصبی مصنوعی (ANN) چندلایه طراحی می‌شوند. این ساختار به آن‌ها اجازه می‌دهد تا در مقایسه با سیستم‌های ساده‌تر مبتنی بر یادگیری ماشین، مانند مدل‌های خطی یا درخت‌های تصمیم، همبستگی‌های پیچیده‌تری ایجاد کنند. ساختار الگوریتم‌های یادگیری عمیق (Deep learning) از مسیرهای متصل به هم نورون‌ها در مغز انسان الهام گرفته شده است.

مدل‌های هوش مصنوعی یادگیری عمیق قادر به شناسایی ویژگی‌های مهم در خود داده‌ها هستند، به جای اینکه مهندسان انسانی نیاز به تعریف این ویژگی‌ها داشته باشند. این ساختار همچنین از الگوریتم‌هایی پشتیبانی می‌کند که می‌توانند از خطاها درس بگیرند و از طریق فرآیند تکرار و تنظیم، خروجی‌های خود را بهبود بخشند. با این حال، سیستم‌های یادگیری عمیق برای ایجاد نتایج خوب به نقاط داده بسیار زیادی (میلیون‌ها یا بیشتر) نیاز دارند. آن‌ها همچنین معمولاً در مقایسه با الگوریتم‌های یادگیری ماشین ساده‌تر، زمان بیشتری برای آموزش نیاز دارند؛ بنابراین هزینه‌های توسعه آن‌ها بالاتر است.

تکنولوژی دیفیوژن یا نفوذ (Diffusion) در تولید محتوا

فناوری دیفیوژن یا نفوذ (Diffusion) هسته اصلی بسیاری از مدل‌های هوش مصنوعی تولیدکننده هنر، موسیقی و متن است. با الهام از علم فیزیک، سیستم‌های دیفیوژن به آرامی ساختار داده‌ها (به عنوان مثال، عکس‌ها، آهنگ‌ها و غیره) را با افزودن نویز تخریب می‌کنند تا زمانی که چیزی باقی نماند. در فیزیک، نفوذ خودبه‌خودی و برگشت‌ناپذیر است؛ شکر پخش‌شده در قهوه را نمی‌توان به شکل مکعب بازگرداند. اما سیستم‌های دیفیوژن در هوش مصنوعی هدفشان یادگیری نوعی فرآیند «نفوذ معکوس» برای بازیابی داده‌های تخریب‌شده است تا توانایی بازسازی داده‌ها از روی نویز را به دست آورند.

تقطیر مدل یا دیستلیشن (Distillation) چیست؟

تکنیک تقطیر مدل (Distillation) روشی است که برای استخراج دانش از یک مدل بزرگ هوش مصنوعی با استفاده از مدل «معلم-شاگرد» استفاده می‌شود. توسعه‌دهندگان درخواست‌ها را به یک مدل معلم ارسال کرده و خروجی‌ها را ثبت می‌کنند. پاسخ‌ها گاهی اوقات با یک مجموعه داده مقایسه می‌شوند تا میزان دقت آن‌ها سنجیده شود. سپس از این خروجی‌ها برای آموزش مدل شاگرد استفاده می‌شود که آموزش دیده است تا رفتاری شبیه به معلم داشته باشد.

از تقطیر می‌توان برای ایجاد یک مدل کوچک‌تر و کارآمدتر بر اساس یک مدل بزرگ‌تر با حداقل کاهش کیفیت استفاده کرد. این احتمالا همان روشی است که OpenAI برای توسعه GPT-4 Turbo، نسخه سریع‌تر GPT-4، از آن استفاده کرده است. در حالی که همه شرکت‌های هوش مصنوعی از تقطیر به صورت داخلی استفاده می‌کنند، ممکن است توسط برخی از شرکت‌ها برای رسیدن به مدل‌های پیشرو نیز استفاده شده باشد. تقطیر از مدل یک رقیب معمولاً شرایط استفاده از خدمات API و دستیارهای چت هوش مصنوعی را نقض می‌کند.

مفهوم واژه فین تیونینگ یا تنظیم دقیق (Fine-tuning)

این اصطلاح به آموزش بیشتر یک مدل هوش مصنوعی برای بهینه‌سازی عملکرد در یک وظیفه یا حوزه خاص‌تر از آنچه قبلاً تمرکز اصلی آموزش آن بوده است، اشاره دارد؛ این کار معمولاً با تزریق داده‌های جدید و تخصصی (یعنی هدفمند) انجام می‌شود. بسیاری از استارتاپ‌های هوش مصنوعی، مدل‌های زبانی بزرگ را به عنوان نقطه شروع برای ساخت یک محصول تجاری در نظر می‌گیرند، اما تلاش می‌کنند تا با تکمیل چرخه‌های آموزشی قبلی از طریق تنظیم دقیق (Fine-tuning) بر اساس دانش و تخصص خاص دامنه خود، کاربرد آن را برای یک بخش یا وظیفه هدف افزایش دهند.

شبکه مولد رقابتی یا گن (GAN) چیست؟

یک GAN یا Generative Adversarial Network (شبکه مولد رقابتی)، نوعی چارچوب یادگیری ماشین است که زیربنای برخی از پیشرفت‌های مهم در هوش مصنوعی مولد هنگام تولید داده‌های واقعی، از جمله (اما نه محدود به) ابزارهای دیپ‌فیک (Deepfake) است. شبکه‌های GAN شامل استفاده از یک جفت شبکه عصبی هستند که یکی از آن‌ها از داده‌های آموزشی خود برای تولید خروجی استفاده می‌کند و این خروجی برای ارزیابی به مدل دیگر فرستاده می‌شود.

این دو مدل اساساً طوری برنامه‌ریزی شده‌اند که سعی کنند از یکدیگر پیشی بگیرند. مدل مولد (Generator) تلاش می‌کند خروجی خود را از مدل تشخیص‌دهنده (Discriminator) عبور دهد، در حالی که متمایزکننده در تلاش است داده‌های تولیدشده مصنوعی را شناسایی کند. این رقابت ساختاریافته می‌تواند خروجی‌های هوش مصنوعی را بدون نیاز به مداخله انسانی بیشتر، واقعی‌تر کند. اگرچه شبکه‌های GAN برای کاربردهای محدودتر (مانند تولید عکس‌ها یا ویدیوهای واقعی) بهتر عمل می‌کنند تا هوش مصنوعی با اهداف عمومی.

توهم هوش مصنوعی (Hallucination) چیست؟

واژه توهم هوش مصنوعی (Hallucination) اصطلاح ترجیحی این صنعت برای زمانی است که مدل‌های هوش مصنوعی اطلاعات نادرست سر هم می‌کنند؛ یعنی به معنای واقعی کلمه اطلاعات غلط تولید می‌کنند. بدیهی است که این یک مشکل بزرگ برای کیفیت هوش مصنوعی است. توهم‌ها خروجی‌هایی را در هوش مصنوعی مولد تولید می‌کنند که می‌توانند گمراه‌کننده باشند و حتی منجر به خطرات واقعی در زندگی شوند که پیامدهای بالقوه خطرناکی دارد (مثلاً یک پرسش سلامتی که توصیه‌های پزشکی مضری را بازمی‌گرداند).

تصور می‌شود مشکل جعل اطلاعات توسط هوش مصنوعی ناشی از شکاف‌ها در داده‌های آموزشی باشد. توهم‌ها به سوق دادن صنعت به سمت مدل‌های هوش مصنوعی فزاینده تخصصی و عمودی (Vertical) کمک می‌کنند؛ یعنی هوش مصنوعی‌های خاص دامنه که به تخصص محدودتری نیاز دارند تا احتمال شکاف‌های دانش و خطرات اطلاعات نادرست کاهش یابد.

فرآیند استنتاج یا اینفرنس (Inference) در هوش مصنوعی

اصطلاح استنتاج (Inference) فرآیند اجرای یک مدل هوش مصنوعی است. این فرآیند به معنای رها کردن یک مدل برای پیش‌بینی یا نتیجه‌گیری از داده‌هایی است که قبلاً دیده شده است. برای شفافیت بیشتر، استنتاج بدون آموزش نمی‌تواند اتفاق بیفتد؛ یک مدل باید الگوها را در مجموعه‌ای از داده‌ها بیاموزد تا بتواند به طور مؤثر از این داده‌های آموزشی استخراج و پیش‌بینی کند.

بسیاری از انواع سخت‌افزارها می‌توانند استنتاج را انجام دهند، از پردازنده‌های گوشی‌های هوشمند گرفته تا پردازنده‌های گرافیکی قدرتمند و شتاب‌دهنده‌های هوش مصنوعی با طراحی اختصاصی. اما همه آن‌ها نمی‌توانند مدل‌ها را به یک اندازه خوب اجرا کنند. پیش‌بینی مدل‌های بسیار بزرگ در مقایسه با سرور ابری مجهز به تراشه‌های هوش مصنوعی رده‌بالا، روی لپ‌تاپ زمان بسیار زیادی طول می‌کشد.

مدل زبانی بزرگ (LLM) چیست؟

اصطلاح مدل‌های زبانی بزرگ (LLM) یا Large Language Models، مدل‌های هوش مصنوعی هستند که توسط دستیارهای محبوب هوش مصنوعی مانند ChatGPT، کلود (Claude)، جمینای گوگل، لاما متعلق به متا، مایکروسافت کوپایلت یا لوشات میسترال استفاده می‌شوند. وقتی با یک دستیار هوش مصنوعی چت می‌کنید، با یک مدل زبانی بزرگ تعامل دارید که درخواست شما را به طور مستقیم یا با کمک ابزارهای مختلف در دسترس مانند مرور وب یا مفسرهای کد پردازش می‌کند.

مدل‌های LLM شبکه‌های عصبی عمیقی هستند که از میلیاردها پارامتر عددی (یا وزن‌ها) تشکیل شده‌اند که روابط بین کلمات و عبارات را یاد می‌گیرند و یک نمایش از زبان، یعنی نوعی نقشه چندبعدی از کلمات را ایجاد می‌کنند. این مدل‌ها از کدگذاری الگوهایی که در میلیاردها کتاب، مقاله و رونوشت پیدا می‌کنند، ایجاد می‌شوند. وقتی به یک LLM دستور می‌دهید، مدل محتمل‌ترین الگویی را که با دستور همخوانی دارد، تولید می‌کند.

کش حافظه (Memory cache) و بهینه‌سازی سرعت خروجی

مفهوم کش حافظه (Memory cache) به فرآیند مهمی اشاره دارد که استنتاج را تقویت می‌کند. در اصل، حافظه پنهان یک تکنیک بهینه‌سازی است که برای کارآمدتر کردن فرآیند استنتاج طراحی شده است. هوش مصنوعی به وضوح توسط محاسبات ریاضی با پتانسیل بالا هدایت می‌شود و هر بار که آن محاسبات انجام می‌شوند، انرژی بیشتری مصرف می‌کنند. حافظه پنهان برای کاهش تعداد محاسباتی که یک مدل ممکن است مجبور به اجرا باشد، با ذخیره محاسبات خاص برای درخواست‌ها و عملیات‌های بعدی کاربر طراحی شده است. انواع مختلفی از حافظه پنهان وجود دارد، اگرچه یکی از شناخته‌شده‌ترین آن‌ها KV caching (کلید-مقدار) است. این قابلیت در مدل‌های مبتنی بر ترانسفورمر کار می‌کند و کارایی را افزایش می‌دهد و با کاهش زمان تولید پاسخ، نتایج سریع‌تری را به همراه دارد.

پروتکل کانتکست مدل یا ام‌سی‌پی (Model Context Protocol)

پروتکل کانتکست مدل یا Model Context Protocol (MCP)، یک استاندارد باز است که به مدل‌های هوش مصنوعی اجازه می‌دهد به ابزارها و داده‌های خارجی (فایل‌ها، پایگاه‌های داده یا برنامه‌هایی مانند اسلک و گوگل درایو) متصل شوند، بدون اینکه توسعه‌دهنده برای هر اتصال یک رابط اختصاصی بسازد. آن را مانند یک پورت USB-C برای هوش مصنوعی تصور کنید. شرکت آنتروپیک (Anthropic) پروتکل MCP را در سال ۲۰۲۴ معرفی کرد و بعداً آن را به بنیاد لینوکس سپرد و از آن زمان توسط گوگل، مایکروسافت و OpenAI پذیرفته شده است و آن را به یکی از سریع‌ترین استانداردهای در حال گسترش در تاریخ اخیر هوش مصنوعی تبدیل کرده است.

معماری ترکیب کارشناسان یا ام‌او‌ئی (Mixture of Experts)

ساختار ترکیب کارشناسان (Mixture of Experts) یا MoE یک معماری مدل است که یک شبکه عصبی را به چندین شبکه فرعی تخصصی کوچک‌تر یا «کارشناس» تقسیم می‌کند و تنها تعداد کمی از آن‌ها را برای هر وظیفه مشخص فعال می‌سازد. به جای هدایت هر درخواست از طریق کل مدل، یک مدل MoE دارای یک «روتر» داخلی است که دقیقاً متخصصان مناسب را برای آن کار انتخاب می‌کند. این امر ساخت مدل‌های عظیمی را امکان‌پذیر می‌کند که نسبتاً سریع و ارزان اجرا می‌شوند، زیرا در هر زمان تنها بخشی از شبکه در حال انجام کار است. مدل Mixtral از شرکت Mistral AI یک نمونه معروف است؛ همچنین به طور گسترده‌ای باور بر این است که مدل‌های جدیدتر GPT شرکت OpenAI نیز از نسخه‌ای از این رویکرد استفاده می‌کنند، اگرچه این شرکت هرگز آن را به طور رسمی تایید نکرده است.

شبکه عصبی (Neural network) چیست؟

یک شبکه عصبی (Neural network) به ساختار الگوریتمی چندلایه اشاره دارد که زیربنای یادگیری عمیق و به طور گسترده‌تر، کل رونق ابزارهای هوش مصنوعی مولد به دنبال ظهور مدل‌های زبانی بزرگ است. اگرچه ایده الهام گرفتن از مسیرهای متراکم متصل به هم در مغز انسان به عنوان یک ساختار طراحی برای الگوریتم‌های پردازش داده به دهه ۱۹۴۰ بازمی‌گردد، اما ظهور بسیار جدیدتر سخت‌افزارهای پردازش گرافیکی (GPUs) از طریق صنعت بازی‌های ویدیویی بود که واقعاً قدرت این نظریه را آزاد کرد. این تراشه‌ها برای آموزش الگوریتم‌هایی با لایه‌های بسیار بیشتر از آنچه در دوره‌های گذشته ممکن بود، مناسب بودند و سیستم‌های هوش مصنوعی مبتنی بر شبکه عصبی را قادر ساختند تا در بسیاری از حوزه‌ها از جمله تشخیص صدا، ناوبری خودکار و کشف دارو به عملکرد بسیار بهتری دست یابند.

مفهوم متن‌باز (Open source) در دنیای هوش مصنوعی

اصطلاح متن‌باز (Open source) به نرم‌افزار یا به طور فزاینده‌ای به مدل‌های هوش مصنوعی اشاره دارد که در آن‌ها کد زیربنایی برای استفاده، بررسی یا اصلاح در اختیار عموم قرار می‌گیرد. در دنیای هوش مصنوعی، خانواده مدل‌های لاما (Lama) متعلق به شرکت متا یک نمونه برجسته است. رویکردهای متن‌باز به محققان، توسعه‌دهندگان و شرکت‌ها در سراسر جهان اجازه می‌دهد تا بر روی کار یکدیگر پلتفرم‌های جدید بسازند، پیشرفت را تسریع کنند و ممیزی‌های ایمنی مستقلی را فعال کنند که سیستم‌های بسته به راحتی نمی‌توانند ارائه دهند. منبع بسته (Closed source) به این معنی است که کد خصوصی است؛ شما می‌توانید از محصول استفاده کنید اما نمی‌توانید نحوه کار آن را ببینید، همان‌طور که در مورد مدل‌های GPT شرکت OpenAI صدق می‌کند؛ تمایزی که به یکی از بحث‌های تعیین‌کننده در صنعت هوش مصنوعی تبدیل شده است.

موازی‌سازی (Parallelization) چیست؟

اصطلاح موازی‌سازی (Parallelization) به معنای انجام کارهای زیادی به طور همزمان به جای انجام آن‌ها یکی پس از دیگری است. در هوش مصنوعی، موازی‌سازی هم برای آموزش و هم برای استنتاج بنیادی است: پردازنده‌های گرافیکی مدرن به‌طور خاص برای انجام هزاران محاسبه به صورت موازی طراحی شده‌اند، که دلیل بزرگی برای تبدیل شدن آن‌ها به ستون فقرات سخت‌افزاری این صنعت است. با پیچیده‌تر شدن سیستم‌های هوش مصنوعی و بزرگ‌تر شدن مدل‌ها، توانایی موازی‌سازی کارها در میان تراشه‌ها و ماشین‌های متعدد به یکی از مهم‌ترین عوامل در تعیین سرعت و صرفه اقتصادی ساخت و استقرار مدل‌ها تبدیل شده است. تحقیق در مورد استراتژی‌های موازی‌سازی بهتر اکنون به خودی خود یک رشته مطالعاتی است.

بحران رم یا رم‌آگدون (RAMageddon)؛ چالش جدید سخت‌افزار

واژه RAMageddon اصطلاح جدید و جذابی برای یک روند نه‌چندان جذاب است که صنعت فناوری را در بر گرفته است: کمبود فزاینده حافظه دسترسی تصادفی یا تراشه‌های RAM که تقریباً تمام محصولات فناوری را که در زندگی روزمره خود استفاده می‌کنیم، تغذیه می‌کنند. با شکوفایی صنعت هوش مصنوعی، بزرگ‌ترین شرکت‌های فناوری و آزمایشگاه‌های هوش مصنوعی که همگی برای داشتن قدرتمندترین و کارآمدترین هوش مصنوعی رقابت می‌کنند، آن‌قدر رم برای تامین انرژی مراکز داده خود می‌خرند که چیز زیادی برای بقیه ما باقی نمی‌ماند و این گلوگاه عرضه به این معنی است که آنچه باقی مانده گران‌تر و گران‌تر می‌شود.

این شامل صنایعی مانند بازی‌های ویدیویی (جایی که شرکت‌های بزرگ مجبور شده‌اند قیمت کنسول‌ها را افزایش دهند زیرا پیدا کردن تراشه‌های حافظه برای دستگاه‌هایشان سخت‌تر است)، لوازم الکترونیکی مصرفی (جایی که کمبود حافظه می‌تواند باعث بزرگ‌ترین کاهش در عرضه گوشی‌های هوشمند در بیش از یک دهه اخیر شود) و محاسبات سازمانی عمومی می‌شود. انتظار می‌رود افزایش قیمت‌ها تنها پس از پایان این کمبود وحشتناک متوقف شود، اما متأسفانه، واقعاً نشانه چندانی وجود ندارد که این اتفاق به این زودی‌ها رخ دهد.

خود‌بهبوددهی بازگشتی (Recursive self-improvement)

مانند AGI، خود‌بهبوددهی بازگشتی (RSI) آستانه‌ای است برای اینکه هوش مصنوعی چقدر می‌تواند هوشمند شود و چقدر کم می‌تواند به انسان متکی باشد. در سناریوی RSI، مدل‌های هوش مصنوعی شروع به بهبود خود بدون مداخله انسانی می‌کنند که منجر به شتاب عظیمی در قابلیت‌ها و خودمختاری می‌شود. در برخی روایت‌ها، این یک لحظه فاجعه‌بار شبیه به تکینگی (Singularity) خواهد بود؛ لحظه‌ای که مدل‌های هوش مصنوعی در برابر مداخله خارجی مصون می‌شوند. اما RSI یک قابلیت اساسی را نیز توصیف می‌کند؛ آیا یک مدل هوش مصنوعی می‌تواند جانشین خود را طراحی کند؟ تعدادی از استارتاپ‌های اخیر هوش مصنوعی برای ساخت مدل‌های خود‌بهبوددهنده بازگشتی آستین بالا زده‌اند، اما بیشتر آن‌ها پیامدهای آخرالزمانی را رد می‌کنند و RSI را صرفاً به عنوان مرز بعدی برای تحقیقات معرفی می‌نمایند.

یادگیری تقویتی (Reinforcement learning)؛ آموزش با پاداش و تنبیه

روش یادگیری تقویتی (Reinforcement learning) راهی برای آموزش هوش مصنوعی است که در آن یک سیستم با امتحان کردن چیزها و دریافت پاداش برای پاسخ‌های صحیح یاد می‌گیرد؛ مانند آموزش دادن به حیوان خانگی خود با تشویقی، با این تفاوت که حیوان خانگی در این سناریو یک شبکه عصبی است و تشویقی یک سیگنال ریاضی است که نشان‌دهنده موفقیت است. برخلاف یادگیری نظارت‌شده (Supervised learning) که در آن مدل روی یک مجموعه داده ثابت از نمونه‌های برچسب‌گذاری شده آموزش می‌بیند، یادگیری تقویتی به مدل اجازه می‌دهد تا محیط خود را کشف کند، اقداماتی انجام دهد و به طور مداوم رفتار خود را بر اساس بازخوردی که دریافت می‌کند به‌روزرسانی نماید. تکنیک‌هایی مانند یادگیری تقویتی از بازخورد انسانی یا RLHF اکنون برای نحوه تنظیم دقیق مدل‌های آزمایشگاه‌های پیشرو هوش مصنوعی جهت مفیدتر، دقیق‌تر و ایمن‌تر بودن آن‌ها محوری هستند.

توکن (Token)؛ واحدهای ساختاری درک هوش مصنوعی

وقتی صحبت از ارتباط انسان و ماشین به میان می‌آید، چالش‌های آشکاری وجود دارد؛ انسان‌ها با استفاده از زبان انسانی ارتباط برقرار می‌کنند، در حالی که برنامه‌های هوش مصنوعی وظایف را از طریق فرآیندهای الگوریتمی پیچیده مطلع از داده‌ها اجرا می‌نمایند. توکن‌ها (Tokens) این شکاف را پر می‌کنند: آن‌ها بلوک‌های ساختمانی اساسی ارتباط انسان و هوش مصنوعی هستند که بخش‌های مجزایی از داده‌ها را نشان می‌دهند که توسط یک LLM پردازش یا تولید شده‌اند. آن‌ها از طریق فرآیندی به نام توکنایزیشن (Tokenization) ایجاد می‌شوند که متن خام را به واحدهای کوچک قابل هضم برای یک مدل زبانی تجزیه می‌کند. در محیط‌های سازمانی، توکن‌ها هزینه را نیز تعیین می‌کنند؛ بیشتر شرکت‌های هوش مصنوعی برای استفاده از LLM بر اساس هر توکن هزینه دریافت می‌کنند، به این معنی که هر چه یک کسب‌وکار بیشتر استفاده کند، هزینه بیشتری پرداخت می‌نماید.

نرخ پردازش توکن (Token throughput) چیست؟

توکن‌ها تکه‌های کوچکی از متن هستند (اغلب بخش‌هایی از کلمات به جای کلمات کامل) که مدل‌های زبانی هوش مصنوعی زبان را قبل از پردازش به آن‌ها تجزیه می‌کنند. نرخ پردازش یا Throughput به این اشاره دارد که چه مقدار می‌تواند در یک دوره زمانی معین پردازش شود، بنابراین نرخ پردازش توکن اساساً معیاری است برای اینکه یک سیستم چه مقدار کار هوش مصنوعی را می‌تواند در یک زمان انجام دهد. نرخ پردازش توکن بالا یک هدف کلیدی برای تیم‌های زیرساخت هوش مصنوعی است، زیرا تعیین می‌کند که یک مدل چه تعداد کاربر را می‌تواند به طور همزمان سرویس‌دهی کند و هر یک از آن‌ها با چه سرعتی پاسخ دریافت می‌نمایند.

مفهوم آموزش یا ترینینگ (Training) در هوش مصنوعی

توسعه هوش مصنوعی‌های یادگیری ماشین شامل فرآیندی است که به عنوان آموزش (Training) شناخته می‌شود. به زبان ساده، این امر به داده‌هایی اشاره دارد که به منظور یادگیری مدل از الگوها و تولید خروجی‌های مفید، به سیستم تزریق می‌شوند. فرآیند آموزش می‌تواند گران باشد زیرا به ورودی‌های زیادی نیاز دارد و حجم‌های مورد نیاز رو به افزایش بوده است؛ به همین دلیل است که رویکردهای ترکیبی، مانند تنظیم دقیق یک هوش مصنوعی مبتنی بر قانون با داده‌های هدفمند، می‌توانند به مدیریت هزینه‌ها بدون شروع کامل از صفر کمک کنند.

یادگیری انتقالی (Transfer learning) چیست؟

تکنیکی که در آن یک مدل هوش مصنوعی از قبل آموزش دیده به عنوان نقطه شروع برای توسعه یک مدل جدید برای یک وظیفه متفاوت اما معمولاً مرتبط استفاده می‌شود؛ این کار اجازه می‌دهد تا دانش کسب‌شده در چرخه‌های آموزشی قبلی دوباره اعمال شود. یادگیری انتقالی (Transfer learning) می‌تواند با ایجاد میانبر در توسعه مدل، صرفه‌جویی در هزینه و افزایش کارایی را به همراه داشته باشد. همچنین زمانی که داده‌ها برای وظیفه‌ای که مدل برای آن توسعه می‌یابد تا حدودی محدود است، می‌تواند مفید باشد. اما توجه به این نکته مهم است که این رویکرد محدودیت‌هایی دارد و مدل‌ها برای عملکرد خوب در حوزه تمرکز خود، احتمالاً به آموزش روی داده‌های اضافی نیاز خواهند داشت.

خطای اعتبارسنجی (Validation loss) چیست؟

اصطلاح خطای اعتبارسنجی (Validation loss) عددی است که به شما می‌گوید یک مدل هوش مصنوعی در طول آموزش چقدر خوب یاد می‌گیرد و هر چه کمتر باشد بهتر است. محققان آن را از نزدیک به عنوان نوعی کارنامه زمان واقعی ردیابی می‌کنند و از آن برای تصمیم‌گیری در مورد زمان توقف آموزش یا تنظیم هایپرپارامترها استفاده می‌نمایند. یکی از نگرانی‌های کلیدی که به پرچم‌گذاری آن کمک می‌کند، بیش‌برازش (Overfitting) است؛ وضعیتی که در آن یک مدل داده‌های آموزشی خود را به جای یادگیری واقعی الگوهایی که بتواند در موقعیت‌های جدید تعمیم دهد، حفظ می‌کند.

وزن‌ها (Weights) در مدل‌های هوش مصنوعی

اصطلاح وزن‌ها (Weights) برای آموزش هوش مصنوعی محوری هستند، زیرا تعیین می‌کنند چقدر اهمیت (یا وزن) به ویژگی‌های مختلف (یا متغیرهای ورودی) در داده‌های مورد استفاده برای آموزش سیستم داده شود و از این طریق خروجی مدل هوش مصنوعی را شکل می‌دهند. به عبارت دیگر، وزن‌ها پارامترهای عددی هستند که تعیین می‌کنند چه چیزی در یک مجموعه داده برای وظیفه آموزشی داده‌شده مهم‌تر است. آموزش مدل معمولاً با وزن‌هایی شروع می‌شود که به طور تصادفی اختصاص داده شده‌اند، اما با پیشرفت فرآیند، وزن‌ها تنظیم می‌شوند زیرا مدل به دنبال رسیدن به خروجی است که به هدف نزدیک‌تر باشد.