Digital-полезности
Графический и веб дизайн, нейросети, веб разработка, SMM и многое другое Связь: @DigiSuppBot
Show more2 906
Subscribers
-124 hours
-87 days
-2930 days
- Subscribers
- Post coverage
- ER - engagement ratio
Data loading in progress...
Subscriber growth rate
Data loading in progress...
Repost from Технологии | Нейросети | Боты
🖼 Расширяем изображение.
Diffusers Image Outpaint — инструмент, который дорисует недостающие области изображения, расширив его по вертикали или по горизонтали.
Загружаем картинку, выбираем нужное соотношение сторон и жмем Generate.
• Попробовать
#neural #нейросеть
@aiaiai
0919 (11).mp47.61 MB
00:36
Video unavailableShow in Telegram
Создаём дипфейки прямо в браузере — вышел сервис Facecam.
Работает ультрапросто: загружаем нужное лицо, включаем камеру и... готово! Самое крутое — можно пользоваться бесплатно, по исчерпанию лимита просто создаём новый аккаунт.
Пользуемся бесплатно — здесь.
U_-Qw_xazoZMrXgi.mp42.00 MB
Repost from GitHub Community
00:20
Video unavailableShow in Telegram
Vehicle AI — это веб-приложение, которое использует Generative AI для идентификации любого транспортного средства.
Используя модель Gemini от Google, оно может определить марку, модель, цвет и год выпуска транспортного средства по изображению.
4️⃣ GitHub
animation.gif.mp41.49 KB
Repost from Душа Питона
00:09
Video unavailableShow in Telegram
10 нейронок, анимирующих лица 🥸
Собрала вам полезные инструменты для оживления портретов.
1️⃣ Emote Portrait Alive (EMO), созданная Alibaba, анимирует картинку и генерит звук.
2️⃣ Follow-Your-Emoji наделяет лицо экспрессивными эмоциями.
3️⃣ Модель VASA-1 от Microsoft создаёт реалистичные говорящие лица.
4️⃣ Китайская Champ может заставить объект двигаться всем телом.
5️⃣ Фреймворк Follow-Your-Click запускает анимацию на отдельных фрагментах картинки.
6️⃣ Ту же работу делает Multi Motion Brush в нейросетях RunwayML.
7️⃣ Fal заменяет лицо на другое.
8️⃣ DeepLiveCam делает это в реальном времени.
9️⃣ С помощью LivePortrait накладываем эмоции из другого источника.
1️⃣0️⃣ EchoMimic анимирует и по аудио, и по ключевым точкам картинки.
Сохраняйте себе, шерьте друзьям ✉️
1.03 MB
Repost from N/a
00:19
Video unavailableShow in Telegram
Gen-3 Alpha — теперь это полноценный ИИ-видеоредактор. Загружаем видео, пишем промт с описанием стиля, в котором хотим получить новый ролик, и через пару минут все готово.
Можно превратить реалистичный ролик в анимацию, поменять декорации, одежду и даже внешность человека.
Выглядит сильно, но доступно только по подписке.
IMG_0433.MP43.73 MB
👍 4❤ 1
01:11
Video unavailableShow in Telegram
У Vidu новая мощная фича — теперь можно генерировать видео не только с лицом нужного человека, а с любым объектом.
Обновление доступно и в бесплатном тарифе, качество не идеальное, но сама фича — топовая.
w7oHzc1WBSabEW25.mp46.71 MB
Repost from Neurogen
Photo unavailableShow in Telegram
Локальные альтернативы популярным нейросетям и AI сервисам.
К сожалению, доступ для российских пользователей постепенно перекрывается все большим количеством компаний, один из последних примеров - ElevenLabs, которые ужесточили получение доступа к своим продуктам из РФ. Поэтому я подготовил для вас подборку локальных (то есть, работающих за счет мощностей только вашего ПК) нейронок, которые смогут заменить онлайн сервисы. Разумеется, многие из них не сравнятся по качеству результата с их облачными аналогами, но зато их точно у вас никто не отключит.
Генерация изображений:
MidJourney, Ideogram, Leonardo, Dall-E 3:
Для начинающих отлично подойдет Fooocus, позволяющий работать с моделями семейства Stable Diffusion XL
Для пользователей с более высоким уровнем требований к функционалу, стоит рассмотреть stable-diffusion-webui-forge и ComfyUI для работы с большинством популярных моделей, такими как SD XL, Flux и многими другими. Эти программы более сложные в освоении, но дают намного больше возможностей и контроля над конечным результатам, а также имеют систему расширений.
Генерация Видео:
Luma, Kling, Vidu, Sora (которая когда-нибудь выйдет):
Тут у нас все немного сложнее. Генеративное видео требует больших вычислительных мощностей от вашего ПК. Тем не менее, вы можете присмотреться к Stable Video Diffusion, а также к недавно вышедшим CogVideoX-5b и CogVideoX-2b. Для последних двух есть специально сделанный вокрфлоу для ComfyUI. Также стоит упомянуть проект Open Sora, но для работы с ним нужная мощная серверная видеокарта, этак на 40 и более гигабайт видеопамяти.
Генерация музыки и звуков:
Suno, Udio:
Тут у нас, к сожалению, не так много достойных альтернатив, которые могли потягаться с сервисами выше. Тем не менее, стоит обратить внимание на StableAudioWebUI, которая работает с Stable Audio Open, а также на аудио-комбайн tts-generation-webui, который позволяет работать с моделями MusicGen и AudioGen
Работа с речью (клонирование речи, текст-в-речь):
Лучше всего для этой задачи подойдет XTTS-WebUI. Данная программа включает в себя работу как с созданием озвучки голосом из текста, так и для преобразования из голоса-в-голос, так как содержит в себе инструментарий для клонирования голоса. Кроме этого, в данной программе есть возможность автоматического перевода и озвучки текста на другом языке.
Генерация текста (языковые модели или чат-боты):
Осваивать мир локальных языковых моделей (или как их еще называют в народе - чат-боты) можно с программы LM Studio. Она позволяет работать с самыми различными моделями, а с недавних пор начала поддерживать работу с вашими документами.
Что же касается моделей, то тут зависит от вашей видеокарты. Универсальным решением для старта будет модель gemma-2-2b-it-abliterated-GGUF, так как она является достаточно легковесной, шустрой, но при этом и весьма неплохо справляющейся с русским языком.
А какие программы и нейронки заменили вам популярные сервисы? Напишите в комментариях свои варианты, а также было бы интересно узнать ваше мнение, на каких из перечисленных программ вы бы хотели увидеть полноценный обзор.
Neurogen
Repost from Технологии | Нейросети | Боты
00:19
Video unavailableShow in Telegram
🤓 Расшифровываем речь на видео.
Read Their Lips прочитает по губам видео без звука или с неразборчивой речью.
Достаточно загрузить видео, выбрать временной отрезок для расшифровки и выделить область, чтобы всё лицо попадало в кадр.
Бесплатно, особенно хорошо справляется с английской речью.
• Попробовать
#нейросети #neural
@aiaiai
0911(1).mp41.99 MB
Photo unavailableShow in Telegram
Нейросеть раскрасит старые фотки и вдохнёт в них вторую жизнь — вышел Image Colorization.
Сервис использует бесплатные модельки Stable Diffusion, чтобы превратить чёрно-белые фотки в цветные — получается бомбезно.
Инструкция по установке уже лежит на GitHub.
❤ 1
Choose a Different Plan
Your current plan allows analytics for only 5 channels. To get more, please choose a different plan.