Jak trenowana jest stabilna dyfuzja? Jak trenowana jest stabilna dyfuzja

Jak trenowana jest stabilna dyfuzja?

Stable Diffusion to jeden z najlepszych generatorów obrazów opartych na sztucznej inteligencji, który pomaga milionom użytkowników tworzyć obrazy w odpowiedzi na polecenia tekstowe. Nie martw się, jeśli używasz Stable Diffusion bez znajomości tego faktu, nie martw się.

Poniższa lektura poinformuje Cię o tym.

Jak trenowana jest stabilna dyfuzja?

Stabilna dyfuzja jest sprawiedliwa kolejny neuronowy procesor języka AI. Działa poprzez przetwarzanie monitów w postaci tekstu ludzkiego w celu utworzenia najlepiej przypominającego obrazu, który go reprezentuje. Firma LAION zbudowała swoje zestawy danych obrazów na podstawie wspólnego indeksowania, innej organizacji non-profit.

Google Bard vs ChatGPT - Który chatbot AI jest lepszy?

Google Bard vs ChatGPT - Który chatbot AI jest lepszy?

Google Bard i ChatGPT to dwa najbardziej wyróżniające się chatboty ze sztuczną inteligencją (AI) dostępne…

Zobacz

Czym jest proces zbierania danych?

LAION zbiera wszystkie znaczniki graficzne z HTML, które zawierają alternatywne atrybuty tekstowe. Następnie sklasyfikował 5 miliardów par obrazów zgodnie z ich ogólnym językiem.

Następnie rozpoczęto filtrowanie zestawów danych zgodnie z ich rozdzielczością, znakami wodnymi i przewidywanymi wynikami estetycznymi.

Wstępny trening

Początkowe szkolenie Stable Diffusion odbywało się na obrazach o niskiej rozdzielczości 256 × 256 pikseli. Później został zaktualizowany do wysokiej rozdzielczości LAION, podzbioru LAION-5b, i miał 170 milionów zdjęć o rozdzielczości ponad 1024 × 1024 pikseli. Jednak wszystkie zostały później zmniejszone do 512 × 512 ze względu na wyniki wydajności.

Czy byłoby możliwe uruchomienie stabilnej dyfuzji za pomocą GPU?

Tak, możesz uruchomić stabilną dyfuzję bez GPU na kilka możliwych sposobów. Na przykład można go używać z DreamStudio, który jest online i nie wymaga aktualizacji sprzętu do płynnej pracy.

GPT-4 kontra ChatGPT: o ile lepszy?

GPT-4 kontra ChatGPT: o ile lepszy?

GPT-4, najnowszy model językowy, już robi furorę. Nowy model ma wiele ekscytujących ulepszeń, w tym…

Zobacz

Wniosek

Stable Diffusion wykorzystuje różne zbiory danych, słowa kluczowe, artystów i postacie. Ponieważ technologia sztucznej inteligencji nie może zrobić niczego samodzielnie, nadal potrzebuje danych wejściowych, których rozmiar ma znaczenie. Jest jednak open source i bardzo elastyczny w użyciu w zasięgu każdego.

Podobne wpisy