my-notebook blog

Word2Vec, 単語ベクトルを2次元でマッピング

word2vec 2d map

Javaで学ぶ自然言語処理と機械学習」という本で紹介されていた Wikipedia でトレーニング済みの単語分散表現データが便利。 このデータの活用例として日本のブランドのマップを作成してみた。

ちなみに、この手の 単語ベクトルを2次元まで圧縮して2D表示的な話は Qitta をはじめあちこちで散々出ているネタですが、自分用メモおよび Ubuntu 18.04 の人および Java で機械学習やりたい人の参考になればと思いシェアします。 もっとも肝心の 2D マップ変換は 普通に Python です。

continue reading…

モバイルモニタ と NUC を USB-C ケーブル一本でつないでデスク周りをすっきりさせた話

一ヶ月ほど前に アイ・オー・データの モバイルモニタ(LCD-MF161XP) を導入しました。 モバイルモニタだがまったくモバイルではなく仕事場で使っているだけです。

以前から ASUS の Zen Display がほしいなとずっと思ってはいたのですが、Ubuntuで使うことが前提だったので、接続方法が微妙で、躊躇していました。 最新の ASUS MB16AC では、USB-C alt mode 対応だったので、 それ対応のUbuntuがインストールできるマシンさえあれば、話は簡単なのですが 手元にそういうマシンがなかったので、モニタ導入して USB-C alt mode 対応マシンを導入して、 そこに Ubuntu を入れて・・・というステップ数が多すぎてやる気をなくしていました。

continue reading…

Macbook 12inch 2017 を入手した話

今更と言うべきか、とうとうと言うべきか、Macbook 12inch 2017 を手に入れました。

MacBook-2017

2018年のはじめには ThinkPad のどれかにするつもりでいたのですが 諸事情により Macbook 12inch にしました。 2018年の5月くらいには腹は決まっていたのですが、6月にはあの WWDC が開催されるので待っていました。 Macbook 2017 を買ったとたんに Macbook 2018 が出るという苦痛には耐えられそうもないので。

continue reading…

MapDB に PDF を保存する、そのために PDFデータを Base64 文字列に encode したり decode したりの話

別に PDF データに限らず Binaryデータを Base64 で文字列にして保存するという話。 時々必要になるがその度にあれどうするんだっけ、となるのでここにまとめておきます。 Groovy の LeftShift Operator (<<) を IO 系のコードで使うと直感的にわかりやす過ぎなのでおすすめです。

continue reading…

MapDB: Javaアプリケーションでちょっとしたデータを保存しておきたい場合に便利

アプリケーションでデータをキャッシュして再利用したい。 たとえば、 Mongo などを使えばそれを実現できるけれど、 UNIXのDBMのような、キーとバリューのセットを保存しておきたいだけなので、 もっと簡単に済ませたい。

Java界隈で DBM っぽいそれと言えば、Berkeley DB がかつては定番だった気がする。 もう少し手軽なものはないかと探してみると MapDB がありました。

continue reading…


Older Posts »