AI開発

AI開発 Flink MLOps 処理エンジン

Flinkの状態管理 × Exactly-once

kojiro777 2025年8月30日 0コメント

一言まとめ遅れて来るデータが前提。**状態（=途中結果のメモ…

AI開発 BentoML MLOps tips

BentoMLでマルチモデルをまとめて提供する：サービス統合のコツ

kojiro777 2025年8月30日 0コメント

ねらい：複数のモデル（例：画像分類のResNet＋テキスト分…

AI開発 DB層 MLOps

スキーマ設計で気をつけたい「JSONBと正規化のバランス」

kojiro777 2025年8月29日 0コメント

MLOpsのDBには「推論リクエストログ」「学習データ」「モ…

AI開発 Django Flink kafka Kinesis MLOps Redpanda

バックプレッシャー制御──“詰まり”を設計で回避する

kojiro777 2025年8月29日 0コメント

TL;DR 設計の基本ラインプラットフォーム別の“詰まり対…

AI開発 Memcached MLOps Redis アプリ開発

ホットキー対策とスケーリング安定化

kojiro777 2025年8月28日 0コメント

背景 RedisやMemcachedをオンライン特徴量ストア…

AI開発 MLOps tips TorchServe Triton

GPU推論サーバーをムダなく使うコツ

kojiro777 2025年8月28日 0コメント

GPUを使った推論サーバー（TorchServeやTrito…

AI開発 KServe MLOps tips

KServeでマルチモデル推論を安定稼働させるコツ

kojiro777 2025年8月28日 0コメント

なぜスケーリング指標が大事？ KServeで複数のモデルを同…

AI開発 MLOps tips アプリ開発処理エンジン

ストリーミング基盤入門：パーティション設計と「レイテンシ vs スループット」実務ガイド

kojiro777 2025年8月28日 0コメント

対象：Kinesis / Kafka（＋Pulsar / R…

AI開発 MLOps tips

WebRTC DataChannelで軽量データを低遅延に送る

kojiro777 2025年8月28日 0コメント

DataChannelってなに？ WebRTCと聞くと「ビデ…

AI開発 MLOps tips

gRPCストリーミング × Djangoゲートウェイ

kojiro777 2025年8月28日 0コメント

🔑 リアルタイム性を高めるコツ AIの推論結果をできるだけ早…

PoC tips アプリ開発ビジネス

家のワンちゃんを3Dで形に！自動ツールでどこまでできるか試してみた

Feast Feature Store Redis

キー設計にTTLを組み込んでスケールと一貫性を両立する

AI開発 Django Envoy gRPC MLOps tips 処理エンジン

Django + gRPC‑Webで「遅れない応答」をつくる

AI開発 DB層 Django Flink kafka Kinesis

スキーマ管理──破壊的変更からシステムを守る仕組み