読む・聞く・書く

読んだ本や書いたコードを共有していきます。

2023-01-01から1年間の記事一覧

効果検証入門のpythonバージョンを書いてみた

ご無沙汰しております。 アカウントを作ったテンションで最初は頑張っていたけど、そのモチベが切れちゃっていたというやつですね。 言い訳をさせてもらえるのなら、精神的に疲れていました。主に人間関係によるものです。ちょっとずつ仕事を任せられる中で…

Essential PySpark Chap1-2

前回に引き続きessential pysparkの第一章を攻めていく。 Big data processing with Spark SQL and DataFrames Transforming data with Spark DataFrames Domain Specific Language (DSL)という操作方法で構築されている immutable 各列はどんなデータ型も取…

Essential PySpark Chap1-1

業務で使用するためこの本を読みながらコードとか試していきます。 本のリンクはこちら https://www.amazon.com/Essential-PySpark-Scalable-Data-Analytics/dp/1800568878 Distributed Computing Data Parallel processing 基本的な考え方はデータが分散し…

SQL 第2版 ゼロからはじめるデータベース操作、読みました

表題の本を読みました!現在、業務でPySparkを使って大規模データを使って機械学習させるって感じのことをやっています。そうなのですが、知識が不足していて結構手が止まっちゃうことが多いんですよね。特にgroupbyとかの操作だったりデータの可視化部分で…

ブログ、やってみた

タイトル通りです。ブログ作ってみました。 目的は自分の学習内容のアウトプットやデータサイエンティストというクソでかワードでは伝わりにくい職種の説明、あとテンションに関する情報も発信していきたいです。 普段はnotionでメモ書きをしていましたが、…