2024-10-01から1ヶ月間の記事一覧

gemini API を wsl2で使う

gemini API を wsl2で使う APIのキーの取得 google ai からAPIキーをもらってくる。 準備 Python を 3.11 にする。pipも更新する。Python 8 系が入っていたので。 ライブラリのインストール pip3 install google-generativeai コード safty-settingはヘイト…

Wikipediaのダンプデータからタイトルを指定して記事を取り出す。

本記事の参考ぺージ Wikipediaのダンプからページを取り出す #Python - Qiita ダンプデータについて Wikpediaのダンプ記事データにはindexとデータ本体の2種類がある。 indexを活用するとbz2ファイルを解凍せずに高速に記事にアクセスできる indexデータ: j…

wsl2でjavascriptのページを手軽にスクレイピング

firefoxをseleniumでヘッドレスで行う。 firefoxのなのはwsl2のubuntuに楽に入るから。 準備 sudo apt install firefox pip3 install selenium pip3 install webdriver-manager コード from selenium import webdriver from selenium.webdriver.firefox.serv…

cygwinでpandasを使えるようにする

2024年くらいからcygwinでpandasが入らなくなった。 バージョンを下げればとりあえず入る。 pip install pandas==1.3.0