Category : github

HazyResearch / ThunderKittens

Tile primitives for speedy kernelsThunderKittens Tile primitives for speedy kernels ThunderKittens is a framework to make it easy to write fast deep learning kernels in CUDA (and, soon, ROCm and others, too!) ThunderKittens is built around three key principles: Simplicity. ThunderKittens is stupidly simple to write. Extensibility. ThunderKittens embeds itself natively, so that if you need more than ThunderKittens can offer, it won’t get in your way of building it yourself. Speed. Ker…

  • четверг, 16 мая 2024 г. в 00:00:01
elder-plinius / L1B3RT45


  • среда, 15 мая 2024 г. в 00:00:04
alibaba-damo-academy / FunClip

Open-source, accurate and easy-to-use video clipping tool, LLM based AI clipping intergrated || 开源、精准、方便的视频切片工具,集成了大语言模型AI智能剪辑功能 FunClip🎥 ⚡ 开源、精准、方便的视频切片工具 🧠 通过FunClip探索基于大语言模型的视频剪辑 「简体中文 | English」 近期更新 | 施工中 | 安装环境 | 使用方法 | 社区交流 FunClip是一款完全开源、本地部署的自动化视频剪辑工具,通过调用阿里巴巴通义实验室开源的FunASR Paraformer系列模型进行视频的语音识别,随后用户可以自由选择识别结果中的文本片段或说话人,点击裁剪按钮即可获取对应片段的视频(快速体验)。 在上述基本功能的基础上,FunClip有以下特色: 🔥FunClip集成了多种大语言模型调用方式并提供了prompt配置接口,尝试通过大语言模型进行视频裁剪~ FunClip集成了阿里巴巴开源的工业级模型Paraformer-Large,是当前识…

  • среда, 15 мая 2024 г. в 00:00:02
fishaudio / fish-speech

Brand new TTS solutionFish Speech This codebase is released under BSD-3-Clause License, and all models are released under CC-BY-NC-SA-4.0 License. Please refer to LICENSE for more details. 此代码库根据 BSD-3-Clause 许可证发布, 所有模型根据 CC-BY-NC-SA-4.0 许可证发布。请参阅 LICENSE 了解更多细节. Disclaimer / 免责声明 We do not hold any responsibility for any illegal usage of the codebase. Please refer to your local laws about DMCA and other related laws. 我们不对代码库的任何非法使用承担任何责任. 请参阅您当地关于 DMCA (数字千年法案) 和其他相关法律法规. Online…

  • среда, 15 мая 2024 г. в 00:00:01
modelscope / agentscope

Start building LLM-empowered multi-agent applications in an easier way.English | 中文 AgentScope Start building LLM-empowered multi-agent applications in an easier way. If you find our work helpful, please kindly cite our paper. Welcome to join our community on Discord DingTalk News [2024-04-30] We release AgentScope v0.0.4 now! [2024-04-27] AgentScope Workstation is now online! You are welcome to try building your multi-agent application simply with our drag-and-drop …

  • вторник, 14 мая 2024 г. в 00:00:11
Mega-Gorilla / Index_PDF_Translation

Indqx PDF 翻訳 概要 Indqx PDF 翻訳は、2024年5月31までwebにて翻訳サービスを提供していた、PDF翻訳のソースコードです。 サービス終了に伴い、Index PDF翻訳を、ローカルで実行可能なコードも提供しています。 Indqx PDF 翻訳は、PDFのフォーマットを崩さずに、翻訳することができる論文向けPDF翻訳サービスです。以下の機能があります。 本文自動認識機能により、論文データの数式やタイトルなどの翻訳不要部分を無視して本文のみを翻訳します。 本文認識はブロックの幅、文字数、フォントサイズにより、分析を行います。 本文ブロックを認識時、終了記号(.:/など)がない場合、複数ブロックを1ブロックとして翻訳します。これによりブロック間やページ間にて翻訳文が途切れる等の問題を解決します。 図や表の説明文のブロックを自動認識し、本文と分割して翻訳します。 ローカル版のインストール 本、レポジトリをクローン後、 以下のコマンドで必要ライブラリをインストールしてください。実行には、Python 3.11環境が必要です。 ライブラリーをインストール p…

  • вторник, 14 мая 2024 г. в 00:00:09
X-LANCE / AniTalker

AniTalker: Animate Vivid and Diverse Talking Faces through Identity-Decoupled Facial Motion Encoding Demo     Paper     Code The weights and code are being organized, and we will make them public as soon as possible. Thank you for your attention. The paper is currently under peer review, and there may still be minor changes. We will update this repository after the official publication. Environment Installation conda create -n anitalker python==3.9.0 conda activate anitalker conda instal…

  • вторник, 14 мая 2024 г. в 00:00:08
linyiLYi / bilibot

A local chatbot fine-tuned by bilibili user comments.哔哩哔哩聊天机器人 由哔哩哔哩用户评论微调训练而成的本地聊天机器人。支持文字聊天,也可以通过 questions.txt 生成针对给定问题的语音对话。 本项目文字生成使用的基础模型为 Qwen1.5-32B-Chat,借助苹果 mlx-lm LORA 示例项目 对基础模型进行微调训练。语音生成部分基于开源项目 GPT-SoVITS,问题语音来自 B 站用户白菜工厂1145号员工训练的派蒙语音模型。 文件结构 项目主要脚本存放在 main/ 文件夹下,模型存放于 models/ 文件夹。提示词模板、问题列表存放在 text/ 文件夹下。tools/ 可以对完整模型进行量化压缩,大大加快模型内容生成速度。 运行指南 本项目基于 Python 编程语言,程序运行使用的 Python 版本为 3.10,建议使用 Anaconda 配置 Python 环境。以下配置过程已在 macOS 系统测试通过。 配置环境 conda create -n bilibo…

  • вторник, 14 мая 2024 г. в 00:00:06
Alpha-VLLM / Lumina-T2X

Lumina-T2X is a unified framework for Text to Any Modality Generation $\textbf{Lumina-T2X}$: Transforming Text into Any Modality, Resolution, and Duration via Flow-based Large Diffusion Transformers         [📄 Lumina-T2X arXiv] [📽️ Video Introduction of Lumina-T2X] [👋 join our WeChat] [🤖️ Lumina-T2I 5B Checkpoints] [🤖️ Lumina-Next-T2I 2B Checkpoints (recommend)] [🕹️ GUI Demo for Lumina-T2I 5B model (node1)] [🔮 GUI Demo for Lumina-Next-T2I 2B model (node2)] [🔮 GUI Demo for Lumina-Next…

  • вторник, 14 мая 2024 г. в 00:00:05