pikesaku’s blog

個人的なプログラム勉強メモです。記載内容について一切の責任は持ちません。

Jubatusチュートリアルメモ

Classifierチュートリアル

jubaclassifierを使って入力データの分類を行う

サンプルプログラムの内容

昔の将軍の名前を入力にして名字をあてる。
例)
入力) 家康→ 出力) 徳川
入力) 尊氏→ 出力) 足利  

Recommender チュートリアル

jubarecommenderを使って類似するデータを推薦する
※jubarecommenderはECサイト商品お勧めなどに利用することができる

サンプルプログラムの内容

プロ野球選手の野手成績を学習し似たタイプ(成績)を推薦する
例)
入力) 中田翔→ 出力) 井口資仁新井貴浩 中村紀洋

Anomaly チュートリアル

jubaanomalyを使って外れ値検知をする
LOFを使う
LOFはN次元空間で、近くにある点がどの程度あるか調べて、外れ値を検知
不正検知、障害検知に利用可能

サンプルプログラムの内容

Regression チュートリアル

jubaregressionを使って線形回帰機能(Regression)を提供する
線形回帰機能は、入力データから出力データを推定する機能
株価予測や消費電力に利用できる

サンプルプログラムの内容

賃貸物件の情報(駅からの距離、面積、年数等)から家賃を推測する

Graph チュートリアル

jubagraphを使ってグラフマイニング機能(Graph)を提供する
グラフマイニング機能は与えられたグラフ構造から中心点や最短距離を抽出する機能
ソーシャルコミュニティ分析やネットワーク構造分析に利用可能

サンプルプログラムの内容

鉄道路線の最短経路を推定するプログラム
例)
入力) 品川・お茶ノ水 出力) 品川→東京→お茶ノ水(最短距離経路)

※山手線と中央線の接続を示すグラフを作成して、上記を実現

Stat チュートリアル

jubastatを使って統計分析機能(Stat)を提供
統計分析機能は時系列データのウィンドウ設定つき分析機能であり、センサー監視や異常データ検知などに利用可能

サンプルプログラムの内容

オレンジ・りんご・メロンの直径・重さ・価格を学習し、フルーツ毎にパラメータの合計値や標準偏差など統計分析をする