هوش مصنوعی فلاکس

FLUX به دلایل خوبی در دنیای تولید تصویر با هوش مصنوعی، سر و صدای زیادی به پا کرده است. این فقط یک مدلِ بیش از حد تبلیغ‌شده و در نهایت بی‌اثر نیست بلکه استانداردهای جدیدی را تعیین می‌کند که توجه همه، از کاربران آماتور گرفته تا کاربران سازمانی را به خود جلب کرده است. در اینجا یک معرفی کوتاه از چیستی آن و نحوه شروع استفاده از آن آورده شده است!

FLUX.1 چیست؟

FLUX.1 یک مدل هوش مصنوعی پیشرفته تبدیل متن به تصویر است، به این معنی که ابزاری است که توضیحات نوشتاری را به تصاویر زنده و بسیار دقیق تبدیل می‌کند. به عبارت دیگر، شما آنچه را که می‌خواهید ببینید توصیف می‌کنید و FLUX آن را در عرض چند ثانیه به واقعیت تبدیل می‌کند.

این اولین محصولِ آزمایشگاه‌های جنگل سیاه (Black Forest Labs) است، گروهی از افراد نوآور که می‌خواهند “مرزهای خلاقیت، کارایی و تنوع” را در مورد تولید تصویر و ویدیو گسترش دهند (در ادامه بیشتر در مورد آنها خواهیم گفت).

این مدل در سه نوع متمایز ارائه می‌شود:

[schnell]: نوع متن‌باز سریع و قدرتمند، تحت مجوز Apache 2.0 در دسترس است. برای تولید سریع و دسترسی آسان طراحی شده است.
[dev]: یک راه حل متن‌باز در سطح سازمانی که خروجی‌های بهتری ارائه می‌دهد و برای استفاده غیرتجاری طراحی شده است.
[pro]: نوع اختصاصی (کد بسته)، شاخص در سطح سازمانی، با امکان استفاده تجاری از طریق APIهای رسمی.

FLUX.1 چگونه از رقبای خود بهتر است؟

صفاتی مانند “کیفیت بالاتر” یا “خلاقانه‌تر”، در حالی که برای FLUX.1 مناسب هستند، واقعاً توضیح نمی‌دهند که چه چیزی آن را بسیار استثنایی می‌کند. پس بدون زیاده‌گویی، فقط حقایق—این مدل در چه چیزی بسیار خوب است؟ ابتدا از سازندگان آن بشنویم:

FLUX.1 وضعیت جدید پیشرفته در ترکیب تصویر را تعریف می‌کند. مدل‌های ما استانداردهای جدیدی را در کلاس مدل مربوطه خود تعیین می‌کنند. FLUX.1 [pro] و [dev] از مدل‌های محبوبی مانند Midjourney v6.0، DALL·E 3 (HD) و SD3-Ultra در هر یک از جنبه‌های زیر پیشی می‌گیرند: کیفیت بصری، پیروی از دستور (Prompt Following)، تغییر اندازه/نسبت تصویر، تایپوگرافی و تنوع خروجی – آزمایشگاه‌های جنگل سیاه

ما می‌خواهیم در مورد سه موضوع کلیدی بیشتر توضیح دهیم: تایپوگرافی، پیروی از دستور و کیفیت بصری.

تولید متن خوانا

مدل‌های تبدیل متن به تصویر به ناتوانی خود در ایجاد متن خوانا مشهورند. به بیان ساده، آنها معمولاً متن‌های کاملاً نامفهوم و بی‌معنی تولید می‌کنند. Stable Diffusion 3 پیشرفت قابل توجهی در این زمینه داشته است، اما همچنان این ایده که هوش مصنوعی نمی‌تواند متن واضح و شفاف تولید کند، بر جامعه سایه افکنده است.

مدل FLUX.1 یک انقلاب واقعی به ارمغان می‌آورد. مطمئناً، ممکن است گهگاه دچار اشتباه شود، اما در کل، دقت آن در ایجاد متن به سادگی بی‌نظیر است. برای بهبود بیشتر، با دستور (prompt) مناسب، می‌توانید به راحتی فونت، اندازه، رنگ و محل قرارگیری متن را کنترل کنید و آن را دقیقاً مطابق با مشخصات مورد نظر خود تنظیم کنید.

کاربردهای عملی احتمالی شامل ایجاد پوستر، ماکت جلد کتاب و جلد آلبوم با هوش مصنوعی، لوگوهای مبتنی بر متن یا هر اثری هنری است که شامل نوعی متن باشد (به عنوان مثال، یک تصویر واقع‌گرایانه با کلماتی که روی شن نوشته شده‌اند) و موارد بسیار دیگر. انبوه گزینه‌ها، هم برای استفاده شخصی و هم برای استفاده حرفه‌ای، واقعاً باورنکردنی است.

پیروی دقیق از دستورات پیچیده

هرچه دستور (prompt) طولانی‌تر و دقیق‌تر باشد، اجرای کامل تمام دستورالعمل‌ها توسط هوش مصنوعی دشوارتر است. در بدترین حالت، ممکن است به نظر برسد که هوش مصنوعی بخشی از دستور را نادیده می‌گیرد یا تفسیر بیش از حدی از ایده سازنده ارائه می‌دهد.

در حالی که کاربران باتجربه‌تر راه‌های مختلفی برای حل این مشکل می‌دانند، مانند دستکاری وزن دستور و مقیاس CFG برای مدل‌های Stable Diffusion، می‌تواند ناامیدکننده باشد. به همین دلیل است که توانایی FLUX.1 در پیروی دقیق از دستورات پیچیده بدون نیاز به تنظیم هیچ پارامتر تولید، یکی از بهترین ویژگی‌های آن است.

اکنون کاربران می‌توانند صحنه‌هایی با عناصر متعدد، سبک‌های هنری خاص و دستورالعمل‌های ترکیبی دقیق را – همه در یک دستور واحد – با اطمینان از اینکه خروجی مطابقت نزدیکی با دیدگاه آنها خواهد داشت، وارد کنند. به عنوان مثال، طراحان داخلی می‌توانند چیدمان اتاق را با چیدمان مبلمان خاص، طرح‌های نورپردازی، پالت‌های رنگ و جزئیات معماری مشخص کنند. طراحی دقیق خانه با هوش مصنوعی هرگز آسان‌تر از این نبوده است.

تصویری را که با این دستور پیچیده “طراحی داخلی یک اتاق نشیمن مدرن با یک مبل سکشنال U شکل از پارچه خاکستری روشن، یک میز قهوه‌خوری کم ارتفاع به رنگ مشکی مات، پنجره‌های سرتاسری با پرده‌های سفید نازک، یک اثر هنری انتزاعی بزرگ روی یک دیوار بتنی بافت‌دار، چراغ‌های سقفی توکار با نور LED گرم قابل تنظیم و یک فرش نرم و پرزدار با پالت رنگی قهوه‌ای مایل به خاکستری ملایم” ایجاد شده است را در زیر ببینید:

ایجاد تصاویر خیره‌کننده در همه اشکال و سبک‌ها

FLUX.1 یک همه‌فن‌حریف است که در واقع بر همه آنها تسلط دارد. هنر پیکسلی می‌خواهید؟ انجام شد. طرح‌های معماری؟ مشکلی نیست. پرتره‌های واقع‌گرایانه؟ شما آن را دارید. این واقعیت که برای یک سبک خاص، به عنوان مثال، هنر انیمه با هوش مصنوعی، تنظیم دقیق نشده است، مانع از آن نمی‌شود که از نظر کیفیت بصری در صدر قرار گیرد.

خواه به دنبال ایجاد یک اسکله فضایی به سبک Cowboy Bebop در هنگام غروب باشید، خواه هنر مفهومی یک موجود خارق‌العاده یا یک نمای بسیار نزدیک و واقع‌گرایانه از قطره شبنم روی یک برگ، با ثبات قابل توجهی ارائه می‌دهد.

چیزی که همچنین ساخته‌ی آزمایشگاه‌های جنگل سیاه را متمایز می‌کند، توانایی آن در اجتناب از مشکلات رایج در تصاویر تولید شده توسط هوش مصنوعی است. می‌دانید برخی از آثار هنری هوش مصنوعی چگونه به نظر می‌رسند… خب، خیلی شبیه هوش مصنوعی؟ مانند انسان‌هایی با دست‌هایی که بیشتر شبیه دستکش‌های بدون انگشت هستند، یا چهره‌هایی که شما را به یاد اثر دره وهمی می‌اندازند؟ در حالی که ۱۰۰٪ بی‌نقص نیست، خانواده مدل‌های FLUX، از جمله [schnell]، حتی هنگام برخورد با دستورات چالش‌برانگیزتر، به طور قابل اعتمادی چشمگیر هستند.

علاوه بر این، در دام یکسان نشان دادن همه چیز نمی‌افتد. با هر تصویر، احساس تکراری بودن نخواهید داشت. هر اثر، تازه و منحصر به فرد به نظر می‌رسد.

چگونه با FLUX.1 تصویر تولید کنیم؟

همانطور که گفته شد، FLUX.1 [schnell] تحت مجوز آپاچی 2.0 در دسترس است. نسخه [dev] نیز به صورت عمومی منتشر شده است، اگرچه فقط برای استفاده غیرتجاری مانند تحقیقات قابل استفاده است. با این حال، در حالی که می‌توانید FLUX.1 را به صورت محلی اجرا کنید، مهم است که توجه داشته باشید که این کار به قدرت پردازش قابل توجهی نیاز دارد.

برای اکثر کاربران، این می‌تواند یک مانع مهم برای ورود باشد. خوشبختانه، FLUX.1 همچنین از طریق پلتفرم‌های آنلاین مانند getimg.ai در دسترس است. به این ترتیب، بدون نیاز به راه‌اندازی‌های پیچیده یا دانلود هر چیزی روی دستگاه خود، می‌توانید در کمترین زمان شروع به تولید تصاویر استثنایی کنید. این سریع‌ترین و آسان‌ترین گزینه است.

FLUX.1 [schnell] و [dev] (با مجوز استفاده تجاری) را می‌توان در حالت Essential ابزار تولیدکننده هوش مصنوعی ما دسترسی داشت. به سادگی دستورالعمل‌ها را دنبال کنید:

در getimg.ai وارد حساب کاربری خود شوید یا یک حساب کاربری ایجاد کنید.
با انتخاب آن از منوی بالا یا کلیک بر روی اینجا، به بخش تولیدکننده هوش مصنوعی بروید.
در بخش “Model” گزینه FLUX.1 [schnell] یا [dev] را انتخاب کنید.
یک دستور بنویسید. می‌توانید برای دریافت یک دستور تصادفی روی یک دکمه کلیک کنید یا از هوش مصنوعی برای بهبود توضیحات خود استفاده کنید.
در صورت تمایل اندازه دسته (از یک تا ده) و نسبت تصویر را تنظیم کنید (FLUX.1 با بسیاری از رزولوشن‌های محبوب به خوبی کار می‌کند). هنگامی که کارتان تمام شد، روی «ایجاد تصاویر» کلیک کنید و منتظر بمانید تا فرآیند به پایان برسد.

همانطور که تمام شد! اکنون می توانید آثار خود را دانلود کنید یا از آنها در سایر ابزارهای ما مانند ویرایشگر تصویر هوش مصنوعی و بوم هوش مصنوعی استفاده مجدد کنید. همچنین می توانید هنگام ایجاد تصاویر جدید با استایل های getimg.ai در حالت Essential یا هر مدلی در حالت SD، از آنها به عنوان مرجع استفاده مجدد کنید. برای کسب اطلاعات بیشتر، راهنمای ما در مورد استفاده از مراجع تصویر را بررسی کنید.

استفاده از getimg.ai ساده و کاربرپسند است و آن را برای مبتدیان و حرفه‌ای‌های باتجربه به طور یکسان در دسترس قرار می‌دهد. آن را امتحان کنید و بدون نیاز به ابررایانه در دفتر کار خانگی، از قدرت FLUX.1 استفاده کنید.

اما فلاکس اصلا از کجا آمد؟

حتی اگر در جامعه تولید تصویر با هوش مصنوعی فعال هستید و تمام اخبار را با دقت دنبال می‌کنید، ممکن است احساس کنید که مدل تبدیل متن به تصویر FLUX.1 از ناکجاآباد پدیدار شده است. و دلیلش این است که… به نوعی همینطور است. این مدل بدون یک کمپین تبلیغاتی پرخرج یا حمایت پر سر و صدای (حداقل یک حمایت رسمی) از هیچ غول هوش مصنوعی مانند Stability AI یا Midjourney، برای اولین بار عرضه شد و به سرعت محبوبیت پیدا کرد.

صفحه آزمایشگاه‌های جنگل سیاه جزئیات زیادی در مورد پروژه ارائه نمی‌دهد، اما نام سازندگان آن را ذکر می‌کند. همانطور که مشخص شد، تیمی که احتمالاً در حال حاضر باعث عرق ریختن بسیاری از شرکت‌های بزرگ شده است، در واقع به عنوان بخشی از خروج عظیم از Stability AI تشکیل شده است. درسته – به نظر می‌رسد گروهی از افرادی که برای شرکتی که مسئول Stable Diffusion بود کار می‌کردند، تصمیم گرفتند به تنهایی آن را انجام دهند (و این کار را با سبک خاص خود انجام دهند).

تیم مؤسس آزمایشگاه‌های جنگل سیاه شامل چندین کارمند سابق Stability AI مانند مدیر سابق تحقیقات کاربردی، رهبر مدل کاربردی و بسیاری از دانشمندان و مهندسان تحقیقاتی می‌شود. علاوه بر این، Anjney Midha که به عنوان مدیر هیئت مدیره Mistral AI و Luma AI فعالیت می‌کند، به عنوان مدیر هیئت مدیره Black Forest Labs نیز انتخاب شد.

این شرکت همچنین در یک دور سرمایه‌گذاری سری A، 31 میلیون دلار جمع‌آوری کرده است و یک هیئت راهنمای قوی را به دست آورده است که شامل کارشناسان تولید محتوا و تحقیقات هوش مصنوعی می‌شود. حالا این یک تیم A واقعی برای تولید تصویر با هوش مصنوعی است!

آینده FLUX.1 چیست؟

سازندگان FLUX.1 به دستاوردهای خود بسنده نمی‌کنند. آنها برنامه‌های بلندپروازانه‌ای برای گسترش پیشنهادات خود، از جمله ایجاد انقلاب در فضای تولید ویدیو با هوش مصنوعی از متن دارند. به احتمال زیاد هدف به چالش کشیدن محصولات برتر موجود مانند Sora و Gen-3 و ارائه راه‌حل‌های مؤثرتر و در دسترس‌تر است. همانطور که آنها بیان می‌کنند، قرار است “تبدیل متن به ویدیوی پیشرفته برای همه” باشد.

یک چیز قطعی است – پس از معرفی FLUX.1، انتظارات از مدل‌های آینده بسیار بالا رفته است. آزمایشگاه‌های جنگل سیاه نشان داده‌اند که مدل‌های نوآورانه هوش مصنوعی می‌توانند از منابع غیرمنتظره بیایند و سلطه غول‌های فناوری تثبیت‌شده را به چالش بکشند.

خواه هنرمند، طراح یا صرفاً یک علاقه‌مند به فناوری باشید، می‌خواهید مراقب ساخته‌های آنها باشید. در همین حال، می‌توانید FLUX.1 را با تولیدکننده هوش مصنوعی ما آزمایش کنید!

اخبار هوش مصنوعی