Недавно мы представили нашу новую умную колонку — Яндекс Станцию Миди. Она больше, чем Лайт или Мини, поэтому в ней уместились вуфер и два высокочастотных динамика с суммарной мощностью звука 24 Вт. Но при этом она легче и компактнее, чем Станция 2 или Макс. Кроме того, в Миди мы внедрили технологии, которые позволили Алисе научиться новому. В частности, благодаря более современному процессору и бо́льшему объёму оперативной памяти, Алиса в Станции Миди впервые стала понимать и выполнять голосо…
Несмотря на весьма серьезные санкции со стороны США, Китай продолжает успешно выпускать современные чипы. Точнее, пока это удается отдельным китайским компаниям, включая Huawei. Соответственно, торговые ограничения, установленные США, работают не так эффективно, как планировалось. Об этом говорится в отчете, подготовленном Комиссией по мониторингу экономических вопросов и вопросов безопасности в отношениях между США и Китаем ( U.S.-China Economic and Security Review Commission). Каким образ…
Последние дни сеть сотрясает новость об увольнении Сэма Альтмана, руководителя коммерческого подразделения OpenAI. Спикеры наперебой упражняются в красноречии и нагоняют тумана, чтобы собирать трафик и по десять раз перепечатывать одни и те же новости под видом новых публикаций. Почему уволили Альтмана? Что за конфликты внутри OpenAI? Что происходит? Человек, который не следил за этим увольнением с самого начала, справедливо подумает, что в рядах разработчиков произошел внутренний переворот…
A neural network that transforms a design mock-up into a static website. A detailed tutorial covering the code in this repository: Turning design mockups into code with deep learning. Plug: 👉 Check out my 60-page guide, No ML Degree, on how to land a machine learning job without a degree. The neural network is built in three iterations. Starting with a Hello World version, followed by the main neural network layers, and ending by training it to generalize. The models are based on Tony Beltrame…
Build it button Draw and sketch UI in Figma and FigJam with this widget. Inspired by SawyerHood/draw-a-ui and tldraw/draw-a-ui. Make sure to replace OPENAI_API_KEY with your API key. Below are the steps to get your widget running. You can also find instructions at: https://www.figma.com/widget-docs/setup-guide/ This widget template uses TypeScript and NPM, two standard tools in creating JavaScript applications. First, download Node.js which comes with NPM. This will allow you to install TypeS…
mobslide Turn your smartphone into presentation remote controller Install Simply Download mobslide from releases on your PC and start it Supported plaforms Works on MacOS and Windows. Tauri for linux doesn't support webrtc so currently Linux isn't supported Usage Scan the QR code with your smartphone and open the link. Keys + Volume up - Volume down Arrow Up Next Arrow Down Previous Arrow Up Long Press Start presentation Arrow Down Long Press Stop presentation Featu…
A fancy, easy-to-use and reactive self-hosted docker compose.yaml stack-oriented manager Dockge A fancy, easy-to-use and reactive self-hosted docker compose.yaml stack-oriented manager. View Video: https://youtu.be/AWAlOQeNpgU?t=48 ⭐ Features Manage compose.yaml Create/Edit/Start/Stop/Restart/Delete Update Docker Images Interactive Editor for compose.yaml Interactive Web Terminal Reactive Everything is just responsive. Progress (Pull/Up/Down) and terminal output are in real-t…
A free and open-source inpainting tool powered by webgpu and wasm on the browser.Inpaint-web A free and open-source inpainting tool powered by webgpu and wasm on the browser. 基于 Webgpu 技术和 wasm 技术的免费开源 inpainting 工具, 纯浏览器端实现。 Demo github.mp4 Demo link:https://inpaintweb.lxfater.com/ Project Roadmap en Image Modification History Historical File Storage Optimize Model Integrate Post-Processing into the Model Integrate Models like Lama and Optimize Speed …
StyleTTS 2: Towards Human-Level Text-to-Speech through Style Diffusion and Adversarial Training with Large Speech Language ModelsStyleTTS 2: Towards Human-Level Text-to-Speech through Style Diffusion and Adversarial Training with Large Speech Language Models Yinghao Aaron Li, Cong Han, Vinay S. Raghavan, Gavin Mischler, Nima Mesgarani In this paper, we present StyleTTS 2, a text-to-speech (TTS) model that leverages style diffusion and adversarial training with large speech language models (SLM…