FLUX به دلایل خوبی در دنیای تولید تصویر با هوش مصنوعی، سر و صدای زیادی به پا کرده است. این فقط یک مدلِ بیش از حد تبلیغشده و در نهایت بیاثر نیست بلکه استانداردهای جدیدی را تعیین میکند که توجه همه، از کاربران آماتور گرفته تا کاربران سازمانی را به خود جلب کرده است. در اینجا یک معرفی کوتاه از چیستی آن و نحوه شروع استفاده از آن آورده شده است!
FLUX.1 چیست؟
FLUX.1 یک مدل هوش مصنوعی پیشرفته تبدیل متن به تصویر است، به این معنی که ابزاری است که توضیحات نوشتاری را به تصاویر زنده و بسیار دقیق تبدیل میکند. به عبارت دیگر، شما آنچه را که میخواهید ببینید توصیف میکنید و FLUX آن را در عرض چند ثانیه به واقعیت تبدیل میکند.
این اولین محصولِ آزمایشگاههای جنگل سیاه (Black Forest Labs) است، گروهی از افراد نوآور که میخواهند “مرزهای خلاقیت، کارایی و تنوع” را در مورد تولید تصویر و ویدیو گسترش دهند (در ادامه بیشتر در مورد آنها خواهیم گفت).
این مدل در سه نوع متمایز ارائه میشود:
- [schnell]: نوع متنباز سریع و قدرتمند، تحت مجوز Apache 2.0 در دسترس است. برای تولید سریع و دسترسی آسان طراحی شده است.
- [dev]: یک راه حل متنباز در سطح سازمانی که خروجیهای بهتری ارائه میدهد و برای استفاده غیرتجاری طراحی شده است.
- [pro]: نوع اختصاصی (کد بسته)، شاخص در سطح سازمانی، با امکان استفاده تجاری از طریق APIهای رسمی.
FLUX.1 چگونه از رقبای خود بهتر است؟
صفاتی مانند “کیفیت بالاتر” یا “خلاقانهتر”، در حالی که برای FLUX.1 مناسب هستند، واقعاً توضیح نمیدهند که چه چیزی آن را بسیار استثنایی میکند. پس بدون زیادهگویی، فقط حقایق—این مدل در چه چیزی بسیار خوب است؟ ابتدا از سازندگان آن بشنویم:
FLUX.1 وضعیت جدید پیشرفته در ترکیب تصویر را تعریف میکند. مدلهای ما استانداردهای جدیدی را در کلاس مدل مربوطه خود تعیین میکنند. FLUX.1 [pro] و [dev] از مدلهای محبوبی مانند Midjourney v6.0، DALL·E 3 (HD) و SD3-Ultra در هر یک از جنبههای زیر پیشی میگیرند: کیفیت بصری، پیروی از دستور (Prompt Following)، تغییر اندازه/نسبت تصویر، تایپوگرافی و تنوع خروجی – آزمایشگاههای جنگل سیاه
ما میخواهیم در مورد سه موضوع کلیدی بیشتر توضیح دهیم: تایپوگرافی، پیروی از دستور و کیفیت بصری.
تولید متن خوانا
مدلهای تبدیل متن به تصویر به ناتوانی خود در ایجاد متن خوانا مشهورند. به بیان ساده، آنها معمولاً متنهای کاملاً نامفهوم و بیمعنی تولید میکنند. Stable Diffusion 3 پیشرفت قابل توجهی در این زمینه داشته است، اما همچنان این ایده که هوش مصنوعی نمیتواند متن واضح و شفاف تولید کند، بر جامعه سایه افکنده است.
مدل FLUX.1 یک انقلاب واقعی به ارمغان میآورد. مطمئناً، ممکن است گهگاه دچار اشتباه شود، اما در کل، دقت آن در ایجاد متن به سادگی بینظیر است. برای بهبود بیشتر، با دستور (prompt) مناسب، میتوانید به راحتی فونت، اندازه، رنگ و محل قرارگیری متن را کنترل کنید و آن را دقیقاً مطابق با مشخصات مورد نظر خود تنظیم کنید.
کاربردهای عملی احتمالی شامل ایجاد پوستر، ماکت جلد کتاب و جلد آلبوم با هوش مصنوعی، لوگوهای مبتنی بر متن یا هر اثری هنری است که شامل نوعی متن باشد (به عنوان مثال، یک تصویر واقعگرایانه با کلماتی که روی شن نوشته شدهاند) و موارد بسیار دیگر. انبوه گزینهها، هم برای استفاده شخصی و هم برای استفاده حرفهای، واقعاً باورنکردنی است.
پیروی دقیق از دستورات پیچیده
هرچه دستور (prompt) طولانیتر و دقیقتر باشد، اجرای کامل تمام دستورالعملها توسط هوش مصنوعی دشوارتر است. در بدترین حالت، ممکن است به نظر برسد که هوش مصنوعی بخشی از دستور را نادیده میگیرد یا تفسیر بیش از حدی از ایده سازنده ارائه میدهد.
در حالی که کاربران باتجربهتر راههای مختلفی برای حل این مشکل میدانند، مانند دستکاری وزن دستور و مقیاس CFG برای مدلهای Stable Diffusion، میتواند ناامیدکننده باشد. به همین دلیل است که توانایی FLUX.1 در پیروی دقیق از دستورات پیچیده بدون نیاز به تنظیم هیچ پارامتر تولید، یکی از بهترین ویژگیهای آن است.
اکنون کاربران میتوانند صحنههایی با عناصر متعدد، سبکهای هنری خاص و دستورالعملهای ترکیبی دقیق را – همه در یک دستور واحد – با اطمینان از اینکه خروجی مطابقت نزدیکی با دیدگاه آنها خواهد داشت، وارد کنند. به عنوان مثال، طراحان داخلی میتوانند چیدمان اتاق را با چیدمان مبلمان خاص، طرحهای نورپردازی، پالتهای رنگ و جزئیات معماری مشخص کنند. طراحی دقیق خانه با هوش مصنوعی هرگز آسانتر از این نبوده است.
تصویری را که با این دستور پیچیده “طراحی داخلی یک اتاق نشیمن مدرن با یک مبل سکشنال U شکل از پارچه خاکستری روشن، یک میز قهوهخوری کم ارتفاع به رنگ مشکی مات، پنجرههای سرتاسری با پردههای سفید نازک، یک اثر هنری انتزاعی بزرگ روی یک دیوار بتنی بافتدار، چراغهای سقفی توکار با نور LED گرم قابل تنظیم و یک فرش نرم و پرزدار با پالت رنگی قهوهای مایل به خاکستری ملایم” ایجاد شده است را در زیر ببینید:
ایجاد تصاویر خیرهکننده در همه اشکال و سبکها
FLUX.1 یک همهفنحریف است که در واقع بر همه آنها تسلط دارد. هنر پیکسلی میخواهید؟ انجام شد. طرحهای معماری؟ مشکلی نیست. پرترههای واقعگرایانه؟ شما آن را دارید. این واقعیت که برای یک سبک خاص، به عنوان مثال، هنر انیمه با هوش مصنوعی، تنظیم دقیق نشده است، مانع از آن نمیشود که از نظر کیفیت بصری در صدر قرار گیرد.
خواه به دنبال ایجاد یک اسکله فضایی به سبک Cowboy Bebop در هنگام غروب باشید، خواه هنر مفهومی یک موجود خارقالعاده یا یک نمای بسیار نزدیک و واقعگرایانه از قطره شبنم روی یک برگ، با ثبات قابل توجهی ارائه میدهد.
چیزی که همچنین ساختهی آزمایشگاههای جنگل سیاه را متمایز میکند، توانایی آن در اجتناب از مشکلات رایج در تصاویر تولید شده توسط هوش مصنوعی است. میدانید برخی از آثار هنری هوش مصنوعی چگونه به نظر میرسند… خب، خیلی شبیه هوش مصنوعی؟ مانند انسانهایی با دستهایی که بیشتر شبیه دستکشهای بدون انگشت هستند، یا چهرههایی که شما را به یاد اثر دره وهمی میاندازند؟ در حالی که ۱۰۰٪ بینقص نیست، خانواده مدلهای FLUX، از جمله [schnell]، حتی هنگام برخورد با دستورات چالشبرانگیزتر، به طور قابل اعتمادی چشمگیر هستند.
علاوه بر این، در دام یکسان نشان دادن همه چیز نمیافتد. با هر تصویر، احساس تکراری بودن نخواهید داشت. هر اثر، تازه و منحصر به فرد به نظر میرسد.
چگونه با FLUX.1 تصویر تولید کنیم؟
همانطور که گفته شد، FLUX.1 [schnell] تحت مجوز آپاچی 2.0 در دسترس است. نسخه [dev] نیز به صورت عمومی منتشر شده است، اگرچه فقط برای استفاده غیرتجاری مانند تحقیقات قابل استفاده است. با این حال، در حالی که میتوانید FLUX.1 را به صورت محلی اجرا کنید، مهم است که توجه داشته باشید که این کار به قدرت پردازش قابل توجهی نیاز دارد.
برای اکثر کاربران، این میتواند یک مانع مهم برای ورود باشد. خوشبختانه، FLUX.1 همچنین از طریق پلتفرمهای آنلاین مانند getimg.ai در دسترس است. به این ترتیب، بدون نیاز به راهاندازیهای پیچیده یا دانلود هر چیزی روی دستگاه خود، میتوانید در کمترین زمان شروع به تولید تصاویر استثنایی کنید. این سریعترین و آسانترین گزینه است.
FLUX.1 [schnell] و [dev] (با مجوز استفاده تجاری) را میتوان در حالت Essential ابزار تولیدکننده هوش مصنوعی ما دسترسی داشت. به سادگی دستورالعملها را دنبال کنید:
- در getimg.ai وارد حساب کاربری خود شوید یا یک حساب کاربری ایجاد کنید.
- با انتخاب آن از منوی بالا یا کلیک بر روی اینجا، به بخش تولیدکننده هوش مصنوعی بروید.
- در بخش “Model” گزینه FLUX.1 [schnell] یا [dev] را انتخاب کنید.
- یک دستور بنویسید. میتوانید برای دریافت یک دستور تصادفی روی یک دکمه کلیک کنید یا از هوش مصنوعی برای بهبود توضیحات خود استفاده کنید.
- در صورت تمایل اندازه دسته (از یک تا ده) و نسبت تصویر را تنظیم کنید (FLUX.1 با بسیاری از رزولوشنهای محبوب به خوبی کار میکند). هنگامی که کارتان تمام شد، روی «ایجاد تصاویر» کلیک کنید و منتظر بمانید تا فرآیند به پایان برسد.
همانطور که تمام شد! اکنون می توانید آثار خود را دانلود کنید یا از آنها در سایر ابزارهای ما مانند ویرایشگر تصویر هوش مصنوعی و بوم هوش مصنوعی استفاده مجدد کنید. همچنین می توانید هنگام ایجاد تصاویر جدید با استایل های getimg.ai در حالت Essential یا هر مدلی در حالت SD، از آنها به عنوان مرجع استفاده مجدد کنید. برای کسب اطلاعات بیشتر، راهنمای ما در مورد استفاده از مراجع تصویر را بررسی کنید.
استفاده از getimg.ai ساده و کاربرپسند است و آن را برای مبتدیان و حرفهایهای باتجربه به طور یکسان در دسترس قرار میدهد. آن را امتحان کنید و بدون نیاز به ابررایانه در دفتر کار خانگی، از قدرت FLUX.1 استفاده کنید.
اما فلاکس اصلا از کجا آمد؟
حتی اگر در جامعه تولید تصویر با هوش مصنوعی فعال هستید و تمام اخبار را با دقت دنبال میکنید، ممکن است احساس کنید که مدل تبدیل متن به تصویر FLUX.1 از ناکجاآباد پدیدار شده است. و دلیلش این است که… به نوعی همینطور است. این مدل بدون یک کمپین تبلیغاتی پرخرج یا حمایت پر سر و صدای (حداقل یک حمایت رسمی) از هیچ غول هوش مصنوعی مانند Stability AI یا Midjourney، برای اولین بار عرضه شد و به سرعت محبوبیت پیدا کرد.
صفحه آزمایشگاههای جنگل سیاه جزئیات زیادی در مورد پروژه ارائه نمیدهد، اما نام سازندگان آن را ذکر میکند. همانطور که مشخص شد، تیمی که احتمالاً در حال حاضر باعث عرق ریختن بسیاری از شرکتهای بزرگ شده است، در واقع به عنوان بخشی از خروج عظیم از Stability AI تشکیل شده است. درسته – به نظر میرسد گروهی از افرادی که برای شرکتی که مسئول Stable Diffusion بود کار میکردند، تصمیم گرفتند به تنهایی آن را انجام دهند (و این کار را با سبک خاص خود انجام دهند).
تیم مؤسس آزمایشگاههای جنگل سیاه شامل چندین کارمند سابق Stability AI مانند مدیر سابق تحقیقات کاربردی، رهبر مدل کاربردی و بسیاری از دانشمندان و مهندسان تحقیقاتی میشود. علاوه بر این، Anjney Midha که به عنوان مدیر هیئت مدیره Mistral AI و Luma AI فعالیت میکند، به عنوان مدیر هیئت مدیره Black Forest Labs نیز انتخاب شد.
این شرکت همچنین در یک دور سرمایهگذاری سری A، 31 میلیون دلار جمعآوری کرده است و یک هیئت راهنمای قوی را به دست آورده است که شامل کارشناسان تولید محتوا و تحقیقات هوش مصنوعی میشود. حالا این یک تیم A واقعی برای تولید تصویر با هوش مصنوعی است!
آینده FLUX.1 چیست؟
سازندگان FLUX.1 به دستاوردهای خود بسنده نمیکنند. آنها برنامههای بلندپروازانهای برای گسترش پیشنهادات خود، از جمله ایجاد انقلاب در فضای تولید ویدیو با هوش مصنوعی از متن دارند. به احتمال زیاد هدف به چالش کشیدن محصولات برتر موجود مانند Sora و Gen-3 و ارائه راهحلهای مؤثرتر و در دسترستر است. همانطور که آنها بیان میکنند، قرار است “تبدیل متن به ویدیوی پیشرفته برای همه” باشد.
یک چیز قطعی است – پس از معرفی FLUX.1، انتظارات از مدلهای آینده بسیار بالا رفته است. آزمایشگاههای جنگل سیاه نشان دادهاند که مدلهای نوآورانه هوش مصنوعی میتوانند از منابع غیرمنتظره بیایند و سلطه غولهای فناوری تثبیتشده را به چالش بکشند.
خواه هنرمند، طراح یا صرفاً یک علاقهمند به فناوری باشید، میخواهید مراقب ساختههای آنها باشید. در همین حال، میتوانید FLUX.1 را با تولیدکننده هوش مصنوعی ما آزمایش کنید!