リムナンテスは愉快な気分

徒然なるままに、言語、数学、音楽、プログラミング、時々人生についての記事を書きます

2018-04-01から1ヶ月間の記事一覧

単語→ID変換

Chainerで機械翻訳 (python) 第7回私はてっきり、分かち書きされた文章をぶち込めば勝手に全部やってくれるのかと思っていたのですが、どうやら単語ごとにIDを振らねばならぬようで。 このあたりを参考に… qiita.com qiita.com コーパスから単語ーID辞書を作…

中国語学習歴ゼロから半年でHSK4級に合格した方法

HSK(汉语水平考试:漢語水平考試)とは、 中国政府教育部(日本の文部科学省に相当)直属の機関である「孔子学院总部/国家汉办」が主催し、中国政府が認定する資格 のことです(日本語公式より引用)。 つまりは中国語版TOEFLみたいなもので、この資格があ…

イスクイル例文

eqal 人間でいる、人間状態であるaiqal 人間になるüqal (何者かは)人間であるeoqal 人間のような何かである To üqal. 私は人間である。To eaqal. 私は男である。To ìuqal. 私は女である。

語学に行き詰ったときに見るページ

備忘録。 基本的な語学の学習順序 それぞれのフェーズは互いに被りうる。 ①文字:~2週間 ②音韻論:~1か月 ③文法(統語論、形態論):~2週間 ④文章のインプット、アウトプット:無限 ①文字 知らない「表音」文字体系のときに勉強する。空で全ての文字を書…

コーパスの整形

Chainerで機械翻訳 (python) 第6回参考: qiita.com 今回は京都大学の「日英中基本文データ」を使おうと思います。 日英中基本文データ - KUROHASHI-KAWAHARA LAB というのも、英語以外の言語で試したかったのでこれにしました。(ゆくゆくはこのデータに追…

バッチ処理

Chainerで機械翻訳 (python) 第5回参考: qiita.com 続きですミニバッチ作成する箇所のコードなんですけど、 # minibatch作成 minibatch = data[num*BATCH_SIZE: (num+1)*BATCH_SIZE] # 読み込み用のデータ作成 enc_words, dec_words = make_minibatch(minib…

学習器

Chainerで機械翻訳 (python) 第4回参考: qiita.com学習部分のコードをがりがり書いていきますよ。 vocab_sizeは参考元だと「辞書」とやらを使っているがよくわからないライブラリの何かだと思われるんで、 今回は定数扱い(あとでnltkで書き直すかも)。ま…