オンラインストア向けにカスタマイズされた新規ビジネス成長ソリューション
バトラー体験を超えるパーソナライズ検索
コスト削減と高精度顧客獲得
コンテンツ制作をゼロからワンへ
DeepSeekシリーズ大規模言語モデル向けに深度最適化した自社開発高性能LLM推論フレームワーク。PD分離、EPLB(優先度スケジューリング)、DeepEP(効率的並列実行)、DeepGEEM(メモリ精密管理)等の主要ソリューションを統合。マルチGPU/ノード環境で推論スループット50%以上向上、ITL(アイドルトークン遅延)を大幅低減、総遅延2倍以上削減を実現し、実業務での大規模モデル展開を強力に支援します。
ByteArkは杭州未来科技城に本社を置くAIインフラとアプリケーションソリューションに特化したテクノロジー企業です。LLM推論フレームワーク最適化、業界特化型AIソリューション、高性能GPUコンピューティングサービスに注力し、基盤技術から業務アプリケーションまでをカバーする統合AIプラットフォーム構築を推進しています。
技術者文化を核とし、チームの70%がグローバル名門大学・フォーチュン500企業出身の技術者で構成され、強力な研究開発能力と国際的視野を有しています。信頼性が高くスケーラブルなAIコンピューティングリソースをグローバルに提供。国家ハイテク企業・浙江省特化型中小企業に認定され、100件以上の特許・ソフトウェア著作権を保有し、グローバルAIインフラサービスネットワーク構築を加速中です。
十分の価値を創造し、三分の報酬を受け、社会に還元する
Create tenfold value, take modest returns, give back to society
客観的事実に基づく深い分析と理性的思考で賢明な判断を下します。価値創造の基礎となる事実と知恵に基づく決断こそ真の価値を生み出します。
開放的な学習姿勢とグローバル視野を保持し、業務・顧客・市場を深く理解します。変化する環境に適応し革新的価値を創造するため、継続的学習が不可欠です。
注意深く聴き正確に理解し、明確かつ簡潔に情報を伝達します。効果的なコミュニケーションは価値をつなぐ架け橋です。
成果に焦点を当て、絶えず改善し、自己限界を突破して卓越を追求します。卓越への追求こそ「十分の価値」創造目標達成の鍵です。
誠実さと正直さを堅持し、誤りを認め修正する勇気を持ちます。誠実さは持続可能な価値の基盤であり、「社会還元」約束実現の保証です。
「起業は航海のようなもの。遠い目標を持ちつつ、途中で島々を発見し補給する」とCEO Davidは起業探求史を表現。成功した連続起業家でありByteArk創設者。2018年杭州ByteArk科技を創設。起業前は半導体業界でスマートフォンプロジェクトに携わるITエンジニア。
1980年代生まれの優秀起業家。製品が世界で販売される複数の実業を創設し、平均年商2000万米ドル超。2014年ブロックチェーン分野の先駆者として取引・資本運営に従事し、豊富な暗号資産運用経験を有す。2018年杭州ByteArk科技に投資創設、運営資金4000万米ドル超、管理暗号資産1億米ドル超。
专注于 推理执行阶段 本身的效率与执行路径优化,包括 Prefill/Decode 阶段的解耦、缓存调度、采样优化等。
1. 负责 LLM 推理系统的执行路径、资源调度与通信模块的系统级优化; 2. 设计并实现支持大规模多卡部署的调度执行架构,提升系统吞吐能力; 3. 优化通信链路与数据传输,减少跨节点通信延迟与带宽瓶颈; 4. 推进混合精度策略(如 FP16、BF16、INT8)在推理框架中的高效应用; 5. 支持并推动开源或自研推理框架(如 vLLM、SGLang)在系统层的深度性能演进。 职位要求: 1. 本科及以上学历,计算机科学、人工智能、软件工程或相关专业; 2. 熟悉主流推理框架,具备 vLLM、SGLang、TensorRT-LLM 等推理框架的优化经验者优先; 3. 熟悉通信优化,具备 NCCL、NVSHMEM、RDMA 等通信库的使用经验,了解通信开销的优化方法; 4. 理解资源管理机制,熟悉任务调度、并发控制、NUMA 架构、CPU/GPU 亲和性优化等系统层优化手段; 5. 具备系统级性能瓶颈分析能力,能够跨模块主导复杂性能问题的定位与解决,推动整体性能优化闭环。
关注推理框架本身的底层基础设施与系统结构,如资源分配、跨节点通信、GPU 编排、混合精度计算等。
1. 负责 LLM 推理系统的执行路径、资源调度与通信模块的系统级优化; 2. 设计并实现支持大规模多卡部署的调度执行架构,提升系统吞吐能力; 3. 优化通信链路与数据传输,减少跨节点通信延迟与带宽瓶颈; 4. 推进混合精度策略(如 FP16、BF16、INT8)在推理框架中的高效应用; 5. 支持并推动开源或自研推理框架(如 vLLM、SGLang)在系统层的深度性能演进。 职位要求: 1. 本科及以上学历,计算机科学、人工智能、软件工程或相关专业; 2. 熟悉主流推理框架,具备 vLLM、SGLang、TensorRT-LLM 等推理框架的优化经验者优先; 3. 熟悉通信优化,具备 NCCL、NVSHMEM、RDMA 等通信库的使用经验,了解通信开销的优化方法; 4. 理解资源管理机制,熟悉任务调度、并发控制、NUMA 架构、CPU/GPU 亲和性优化等系统层优化手段; 5. 具备系统级性能瓶颈分析能力,能够跨模块主导复杂性能问题的定位与解决,推动整体性能优化闭环。