hpp Profile Banner
hpp Profile
hpp

@hpp_ricecake

4,919
Followers
1,147
Following
1,029
Media
18,413
Statuses

絵と服とゲーム | 学振DC1 | NLP Dの会幹事 @hayato_tkgs

Nagoya Univ. D2
Joined October 2018
Don't wanna be here? Send us removal request.
Pinned Tweet
最近やってる/やってたことのスレ:
BERTによるテキスト分類のチュートリアルを公開しました! ・ライブドアニュースコーパスを対象とした9値分類 ・前処理+主要な評価指標の算出 ・実験結果の管理 をモダンな記法・設計で実装しました。 深層学習・NLP初学者の方をはじめ、色々な方の参考になれば嬉しいです!
4
157
910
1
1
29
@hpp_ricecake
hpp
2 years
うおおおおメルカリのデータセットだ、デカすぎんだろ!!!! > 商品データ,コメントデータはCSV形式で,サイズはそれぞれ約100GB,約40GBです。画像データはサムネイル画像で約2TB,オリジナル画像で約1TBです。
4
960
3K
@hpp_ricecake
hpp
5 years
いやマジで、用語の暗記は学問の本質でないってのは凄いわかるんだが、基本的な語句すら覚えてない程度の勉強量で議論なんて出来ない
1
383
2K
@hpp_ricecake
hpp
4 years
弊学湧水が出るらしくて湧水で冷やして電気代めちゃくちゃ節約しているらしい、ウケる
@hpp_ricecake
hpp
4 years
豪華だ
Tweet media one
0
67
191
5
668
2K
Pythonでリストの中にある要素が存在しているか判定しようとしている人、今すぐsetを使うんだ、頼む、存在判定がO(n)→O(1)になるんだ、頼む
7
160
2K
@hpp_ricecake
hpp
4 years
本日のキャサリンママ #フブキch #絵フブキ
Tweet media one
12
187
1K
@hpp_ricecake
hpp
4 years
友人のPCが開きっぱなしだったので alias cd="firefox " を実行しておいた
6
321
1K
BERTによるテキスト分類のチュートリアルを公開しました! ・ライブドアニュースコーパスを対象とした9値分類 ・前処理+主要な評価指標の算出 ・実験結果の管理 をモダンな記法・設計で実装しました。 深層学習・NLP初学者の方をはじめ、色々な方の参考になれば嬉しいです!
4
157
910
@hpp_ricecake
hpp
11 months
LLMをただの事前学習済み言語モデルとして扱い、微調整にLoRAを利用して、”普通の”テキスト分類を行う実装をGitHubで公開しました。 zero/few-shotではなく、BERTの[CLS]を使うように、普通に分類を文末トークンの埋め込みでやります。 結果としてはかなり強かったです🤔
Tweet media one
1
126
728
@hpp_ricecake
hpp
3 years
深層学習の学習待ちにおすすめのVSCode拡張を書く 最推し: Error Lens エラーやwarningsがエディタ上にハイライトで表示されるようになる めちゃくちゃ便利
Tweet media one
1
87
702
たった18時間で移管したのか…すげぇ…
Tweet media one
1
172
605
@hpp_ricecake
hpp
2 years
ChatGPT、変数名とか考える時にマジで便利
Tweet media one
1
79
562
@hpp_ricecake
hpp
5 years
世のエンジニアの平均がわからん、Twitterを見ている感じエンジニアなら誰でもコンパイラとOSを自作できて青コーダーでトップカンファに論文を通したことがある、という感じがする
1
134
492
@hpp_ricecake
hpp
4 years
AtCoderでRustを使う一億個の理由のうちの一つがこれ
Tweet media one
4
84
457
@hpp_ricecake
hpp
3 years
2021夏のITエンジニアインターン情報が集まる魔法のスプレッドシートの管理を引き継ぎました、 @kaito_tateyama くんとの共同管理です👌 誰でも編集できるので、推し企業の情報などドシドシ追加して貰えると嬉しいです😘 過去のインターン体験記の欄もあるのでそちらもぜひ〜!
1
116
410
#NLP2023 の「日本語Tokenizerの違いは下流タスク性能に影響を与えるか?」が非常に素晴らしかった tokenizerと辞書の組み合わせ18種類について **事前学習 + fine-tuning** を行い、日本語タスクによる網羅的な評価で形態素解析器の有無による性能差等を明らかにしている
Tweet media one
Tweet media two
4
99
410
@hpp_ricecake
hpp
4 years
名古屋大学大学院情報学研究科知能システム学専攻博士前期課程入学試験に合格しました!!!!!!!!!!!!!
31
10
393
@hpp_ricecake
hpp
3 years
GitHub Copilotを試してみた。 せっかくなので大学院の課題について文章生成。 見出しと各文の先頭の節「ナップサック問題とは」「これは、」「解法としては、」「今回は」「具体的な手順は、」「1, 2, …」… を入力し、その後ろをCopilotで補完した。 課題やらせてもギリバレない気がするな…
Tweet media one
0
70
353
@hpp_ricecake
hpp
2 years
ブログを書きました! 先月人生で初めて現地参加した国際学会で、COVID-19に感染しちゃって色々あったぜ、というお話です。 何かの参考になる方がいれば幸いです🙏
0
120
324
@hpp_ricecake
hpp
2 years
学振DC1に採用内定しました、今後とも精進します!!!!
24
3
315
@hpp_ricecake
hpp
2 years
argparseの長年の問題を解決する最高ライブラリだ
Tweet media one
@moisutsu
モイスツ
2 years
自作のクラスで定義するコマンドラインパーサーclassoptの紹介記事を公開しました🎉 argparseの代わりにこのライブラリを使うと、コマンドライン引数に補完を効かせながら、コーディングを行うことができます👍
1
44
228
0
62
311
@hpp_ricecake
hpp
3 years
人間の脳、パラメータが馬鹿みたいに多いだけで特に神秘的な何かはなかった説
1
33
300
@hpp_ricecake
hpp
3 years
「深層学習は人間の脳を模している」という人にTransformerのアーキテクチャを見せて「脳のどこらへんだと思います?」と聞いて回る仕事
3
41
292
注意機構の空間計算量問題がシレッと解決されて、系列長に対して線形に改善されてるのに驚いたのは俺なんだよね(PyTorch 2.0から使えるFlashAttention)
Tweet media one
1
41
281
@hpp_ricecake
hpp
6 months
コーパス整備偉すぎるマジで
Tweet media one
0
48
281
@hpp_ricecake
hpp
3 years
Pytorch Lightning, Hydra, Mlflow, Poetryを使った深層学習プロジェクトのテンプレを作りました、`poetry install`で一発でインスコできて便利 Mflowでログ確認、Hydraで複数の実験条件をお手���に試せます マルチGPU, 半精度浮動小数点数での訓練も引数変えるだけで動く
1
36
275
@hpp_ricecake
hpp
2 years
jupyter notebookで実験回すの、プログラムを書くタイプの実験に慣れてない人ほどやめておいた方が良い、オブジェクトがいつ破棄されているかとかどのデータmutableでどういう処理が挟まったとか、そういうのを全て頭の中のsymbol tableに載せられるほど熟練してからやるべきだと思っている
1
33
257
@hpp_ricecake
hpp
6 months
複素数の絶対値を取るぜ、と論文に書いてあるが嘘で実装ではa + biについて|a| + |b|を取るぜ!っていう手法があって真顔になってる
2
32
250
@hpp_ricecake
hpp
2 years
出オチ感めっちゃ好き(ちゃんと全部説明される)
Tweet media one
1
15
232
@hpp_ricecake
hpp
3 years
読んでる記事に"Accepted to arXiv."と書いてあり、迫力があった
0
34
228
@hpp_ricecake
hpp
4 years
授業料全額免除きちゃぁあああああ
3
2
220
@hpp_ricecake
hpp
3 years
Pythonコード10行くらいで簡単に性能上がるぜ!みたいな手法を見つけたので、論文の実装そのまま使ってみたら馬鹿みたいに性能下がって爆笑してる、バーカ!
1
13
218
@hpp_ricecake
hpp
2 years
書きました〜! MeCabを並列に動作させることで巨大なテキストファイルの分かち書きを高速化したよという話です。 約2GBのファイルに対して、並列に読み込み・分かち書き・書き込みをすることで、順に読み込んで分かち書きする場合と比較して7~8倍高速化しました!
2
39
220
@hpp_ricecake
hpp
2 years
おー! いつもPythonの自作パッケージのパスを通すのにsys.path.appendしていて、省略する自作のライブラリ()も作ったことがあるのだけど、Poetryを使ってるならこんな感じの文言をpyproject.tomlに書いてpoetry installをするだけでパスを通せるのがわかった!便利!
Tweet media one
2
21
216
@hpp_ricecake
hpp
2 years
こういうデータセット、権利など研究用に公開するのにめちゃくちゃハードルがあっただろうに、それを乗り越えて広く使えるようにしてくれるの本当にありがたいな… そんなメルカリの方の講演が10/28にあるので要チェックだ(not 回し者)(他の方の講演も最高に楽しそう)
0
45
213
今のところ東北大BERT-large v2が一番強い(煩雑な前処理不要だしみんな使うといいと思う)
東北大BERT v3で日本語文埋め込みモデルの評価始めた、夕方くらいには少し結果出てそう
0
1
20
0
30
210
@hpp_ricecake
hpp
3 years
うおおおおおおおおおおおお!!!!!!!!!!(初 Accepted!!!!!!!!!!!!!!!!!!!!)
15
2
209
@hpp_ricecake
hpp
3 years
名古屋大学情報学部を無事卒業できることになりました、感謝! 4月から名古屋大学大学院情報学研究科で自然言語処理の研究を続けます、よろしくお願いします🤲
5
0
196
@hpp_ricecake
hpp
4 years
豪華だ
Tweet media one
0
67
191
@hpp_ricecake
hpp
2 years
みんなが全然知らなさそうだけどBERTの事前学習でやられてる大事そうなtips
Tweet media one
1
16
194
@hpp_ricecake
hpp
3 years
もうGoogleは完全にTensorflowからJax/Flaxに行く流れっぽいな
1
19
188
@hpp_ricecake
hpp
11 months
諸々あって今夏はPFNさんでインターンさせていただくことになりました! 東京にしばらく滞在しそうなので、お会いできそうな方がいたらよろしくお願いします🙏
5
2
189
@hpp_ricecake
hpp
3 years
重ねて、令和3年度JEES・ソフトバンクAI人材育成奨学金の奨学生に選ばれました(80,000円/月)。 選んでいただいたからにはそれに恥じない貢献をしていきたいと思います、頑張ります💪
2
3
186
修了しました!!!!!!!!!!!!6年間対あり🙏 あと3年間対よろ!!
Tweet media one
2
0
184
@hpp_ricecake
hpp
4 years
凄い褒められるなココ
Tweet media one
0
15
183
@hpp_ricecake
hpp
2 years
大変光栄なことに、深層学習関連の高品質な解説記事を公開されているステート・オブ・AI・ガイドさんに、データを「箱」で表現するBox Embeddingの紹介記事を寄稿させていただきました。 Box Embedding関連の複数の論文のストーリーを意識してまとめました。 ぜひご覧ください!(無料です!)
@stateofai_ja
ステート・オブ・AI ガイド
2 years
近年普及している単語埋め込み技術は、単語を「点」でしか表現できず、概念の広がり等を表現できません。 本記事では、単語を「箱」として表現する最新・強力な埋め込み手法「Box Embedding」を基礎から解説しました。 名古屋大学の塚越さん ( @hpp_ricecake )による執筆です
0
174
728
2
28
174
@hpp_ricecake
hpp
9 months
torch.compile(mode="max-autotune")、早くなりすぎで草
1
10
167
@hpp_ricecake
hpp
4 years
GitHub Actions、いつのまにかサーバレスコンピューティング目的でも使えるようになっていてビビった、最強じゃん
Tweet media one
2
45
166
@hpp_ricecake
hpp
2 months
東工大のSwallow-MXを用いてWikipediaのテキストに基づく質問と回答を生成させたデータセット AutoWikiQA をHuggingFace上に公開しました! 約240万事例と日本語QAデータセットの中でも最大規模かつ高多様性なデータセットです ライセンスはCC BY-SA 4.0で商用利用可です!
1
48
165
@hpp_ricecake
hpp
3 years
筆記がマジでギリギリだけどDBスペシャリスト合格した🤔
Tweet media one
3
0
160
@hpp_ricecake
hpp
4 months
日本語Wikipediaの2024年1月のHTML dumpから抽出したテキストデータセットを公開しました、かなり綺麗で使いやすい気がしてます 以下推しポイント ・不要なマークアップなし ・セクション・段落構造を保持 ・Wikiextractorによるテキストを併記 ・テンプレートタグを同梱
2
29
163
@hpp_ricecake
hpp
3 years
自然言語処理のトップカンファレンスの一つであるACLの本会議に採択された論文を公開しました。 定義文から単語を予測するだけで、結構いい文埋め込みモデルが得られるよという話です。 タスクとアーキテクチャが結構シンプルで気に入っています。
@hayato_tkgs
Hayato Tsukagoshi
3 years
We (w/ @cacaho , Prof. Takeda) published our paper "DefSent: Sentence Embeddings using Definition Sentences" accepted at #ACL2021NLP main conference (short). We show that a simple "definition -> word" fine-tuning can yield a good sentence embedding model.
Tweet media one
0
9
62
2
22
160
@hpp_ricecake
hpp
4 years
プログラミングを道具として見れちゃう人、普通にプログラミング楽しんでると愛着とか湧いちゃうと思うんだけど人の心無いのかな
3
24
150
@hpp_ricecake
hpp
5 years
その2000字くらいの説明は、勉強していれば10字くらいで説明できるんや…頼む…
0
56
142
@hpp_ricecake
hpp
2 months
本日行われた弊研究科の中間発表会で最優秀発表賞を2件いただきました、今後も精進します…!
Tweet media one
1
3
145
@hpp_ricecake
hpp
3 years
なんだァ?てめェ......
Tweet media one
1
5
138
@hpp_ricecake
hpp
3 years
名古屋大学情報学部を卒業しました、4月からは同大学大学院で自然言語処理の研究を続けます。 今後ともどうぞよろしくお願いいたします🤲
Tweet media one
Tweet media two
3
2
142
@hpp_ricecake
hpp
4 months
Rye + uv最高すぎる、全てを過去にした
2
14
140
@hpp_ricecake
hpp
3 years
ご報告遅れましたが先月からメルカリさんでインターンお世話になっています、とても楽しくてすごいとなっています
1
1
139
@hpp_ricecake
hpp
2 years
誕生日です、24歳になりました 12の倍数でキリがいいです 今後も頑張ります、どうぞよろしくお願いします!!
23
0
138
めっちゃ頑張ってLoRAの解説資料書いたから見て!!(初学者向けに分野の変遷も自分なりに書いてみたからコメントくれ!!!!)
@hayato_tkgs
Hayato Tsukagoshi
1 year
事前学習済みモデルに対し、ごく小さな低ランク行列のみを学習するだけでfine-tuningと同等性能を発揮できる手法 LoRA の論文解説資料を公開しました! Transformer・BERTからChatGPTを含む深層学習を用いた自然言語処理の変遷についても紹介しています。 ぜひご覧ください!
3
251
1K
0
11
133
@hpp_ricecake
hpp
8 months
本日よりPreferred Elementsの業務に関わることになりました、よろしくお願いいたします🙏(籍はPFNのままで業務内容がPFEに)
0
0
133
@hpp_ricecake
hpp
7 months
『ゼロから作るLLM』、存在してほしい(まずは資金調達してA100を1024枚買うところから)
0
13
130
@hpp_ricecake
hpp
2 years
既存ツールをRustで置き換えるの、Rustの勉強にもなるし、既存ツールの挙動を参考により良いものを作れる可能性が高いし、興味がある人もたくさんいるから持続可能性も高いし、元が遅い言語ならほぼ確実に早くなるしで、かなり進めやすく性質が良いプロジェクトに見える
0
13
129
@hpp_ricecake
hpp
3 years
青空文庫のテキストデータだけ欲しい人用に aozorabunko-extractor というツールを作った🎉 画像のように、テキスト部分のみを取り出して「。」を基準に改行区切りにしたり、文献ごとに二重改行区切りにしたりする なんらかの 言語モデルを作る時に使うと便利だと思う
Tweet media one
Tweet media two
1
36
124
@hpp_ricecake
hpp
4 months
Accepted!!!!!!!!
1
1
123
日本語敵対的自然言語推論データセットのJaNLIをHuggingFace Datasets上で利用できるようにしました!! かなり簡単に触れるようになっているので、さまざまな言語学的現象に基づく摂動に対する、日本語モデルの振る舞いを観察するのにとても適していると思います🙏
Tweet media one
0
21
119
@hpp_ricecake
hpp
3 years
晴れて歳を取りました、今後もどうぞよろしくお願いします
31
0
121
@hpp_ricecake
hpp
5 years
ポートフォリオサイトできましたー! Gatsby.js(Reactのblazing fast🔥な静的サイトジェネレータ)とTypeScriptで開発しました!WebGLでShaderを触ってて、Netlify CMSでブログも書ける🌝あとMDXも使えます🎃 デザインから設計・開発まで全部好き放題できて大満足!! 見てね👴
2
16
116
@hpp_ricecake
hpp
4 years
わーい!!優勝しました!!!!!!!! 快適なコンテスト環境やサポートなどありがとうございました\\\\٩( 'ω' )و //// #catechchallenge
Tweet media one
10
10
118
@hpp_ricecake
hpp
2 years
2018年の研究にPython2使ってる人、一体何を考えているんだ
1
15
117
@hpp_ricecake
hpp
4 years
RustでTwitter APIを叩くいい感じのcrateがなかったので自作していた、Rust製のTwitter API bindings「Kuon」をリリースしました(すごくWIP) APIからのレスポンスの型付けやテストなどまだまだ書けていないので、是非PRください!!(やること多くて楽しいと思います)
Tweet media one
1
30
113
@hpp_ricecake
hpp
6 months
Mixtralに対し日英対訳データセットでQLoRA tuning (SFT)を施した日⇔英 翻訳モデル(のLoRA層)をHuggingFace上に公開しました。 それと、訓練に利用したコードをGitHub上に公開しました。自前データ訓練の足掛かりにもなると思います、何卒...
@hpp_ricecake
hpp
6 months
Mixtralを小説の対訳データセット() でSFT的に翻訳タスクでQLoRA tuningしてみた 日本語の生成がおっそいが普通に動いていそう(文章レベルで翻訳できててえらい)
Tweet media one
2
4
32
1
26
111
京大のRoBERTaはめっちゃ性能高いよ(ボソッ)
3
7
111
@hpp_ricecake
hpp
2 years
tqdmについてはdynamic_ncols=Trueとtqdm.writeを覚えておけ
1
3
112
@hpp_ricecake
hpp
3 years
今日からNTTのCS研で1ヶ月お世話になります、よろしくお願いします🤲
2
0
108
@hpp_ricecake
hpp
3 years
日本語GPT-2 (rinna/japanese-gpt2-medium)の単語埋め込みの可視化 頻度順上位1000, 3000, 10000トークンをt-SNEで2次元に 4枚目は10000トークンの可視化のズーム画像なんだけど、結構びっくりな結果で、この画像だと数字が順番に並んでいるように見える お前数字が読めるのか...?
Tweet media one
Tweet media two
Tweet media three
Tweet media four
2
16
106
ステート・オブ・AIガイドさんに3本目の記事を寄稿させていただきました!! 今回は長い系列を効率的に処理できる(Self-AttentionがO(N^2)なのに対してO(N log N))ことで話題になったS4の後続研究について紹介しました 音声や画像処理などで特に使いやすいモデルだと思うのでぜひに〜!!
@stateofai_ja
ステート・オブ・AI ガイド
1 year
「次世代のトランスフォーマー」として有望視される S4。状態空間モデルに基づき、高性能・高効率に長い系列を処理できることで話題になりましたが、S4D、H3、SGConv など、その後続研究が続々と登場しています。 本記事では、S4 の発展的な研究を厳選して解説しました。
0
65
359
0
13
102
@hpp_ricecake
hpp
6 months
Mambaの訓練レシピ、とりあえずこれ使っとけばええやろなヤツが集まっててえらい
Tweet media one
1
7
102
@hpp_ricecake
hpp
4 years
これめっちゃ知見なんですけど、取り組んでるものにカッコいい名前をつけるとモチベ爆上がりします
0
21
93
@hpp_ricecake
hpp
11 months
ハイパラ��索&多様なデータセットでの評価をちゃんとやった結果早稲田RoBERTa-largeが一番強かった(東北大BERT-large v2との比較で考えるとやっぱJuman++をtokenizerに使ってるのがいいのかな)
今のところ東北大BERT-large v2が一番強い(煩雑な前処理不要だしみんな使うといいと思う)
0
30
210
1
12
97
@hpp_ricecake
hpp
3 months
東北大BERT-largeに対し、batch size 8192, 系列長 256で、日本語WikipediaやMMARCOといった弱教師データによる対照事前学習を行ったモデルであるshioriha-large-ptを公開しました。 文埋め込みにおける日本語対照事前学習の事例はまだまだ少ないので、今後も頑張り���す!!
1
21
94
@hpp_ricecake
hpp
6 months
実はさらに嘘で |a + b| を取っているようでした、わけがわからない
1
11
94
@hpp_ricecake
hpp
2 years
Python 3.11、ゲキアツ!
Tweet media one
1
25
93
@hpp_ricecake
hpp
2 years
入力系列長が数万に及ぶような長い系列を効率的に扱うことができる最近提案されたモデル S4の解説(松尾研の輪読会動画) S4の何が嬉しいのかなど、モチベーションや周辺知識が丁寧に説明されていてとてもよかった
0
6
90
@hpp_ricecake
hpp
9 months
社内コードベースでCUDA kernelとかZeROの改善実装がモリモリされてるの見れてクソおもろかったやつだ
Tweet media one
0
10
90
修論発表終わったー!!!!!
4
0
90
@hpp_ricecake
hpp
5 years
わーい入水した!!!!!!!!!!!!!!! これからも頑張るぞ〜〜っっ hppさんのAtCoder Beginner Contest 142での成績:693位 パフォーマンス:1494相当 レーティング:1178→1216 (+38) :) Highestを更新し、4 級になりました! #AtCoder
Tweet media one
13
5
88
@hpp_ricecake
hpp
4 years
CAでのインターン、社会情勢も踏まえ本日で終了と相成りました! 最後数日出来なかったのは残念だったけど、めちゃくちゃ楽しかったので満足!!!!!!! また参加しにきます、ありがとうございました!!!!!!!!!!
Tweet media one
6
2
89
@hpp_ricecake
hpp
3 years
NTT CS研でのインターンが無事終了しました、楽しかった!!
0
1
88
@hpp_ricecake
hpp
3 years
多分卒業です、最終的なGPAはこんな感じでした(最大4.30)
Tweet media one
2
2
87
@hpp_ricecake
hpp
4 years
死が急速に接近する瞬間が、一番生を実感する
Tweet media one
1
11
83