データサイエンスがその時代の最も有望な仕事であるとして1位にランクされていたので、私たちは皆、次のレースに参加しようとしています。 。 SQL for Data Scienceに関するこのブログ投稿は、SQLを使用してデータを保存、アクセス、取得してデータ分析を実行する方法を理解するのに役立ちます。
これが予定されているトピックのリストです このブログで取り上げられています:
データサイエンスにSQLが必要なのはなぜですか?
毎日2.5兆バイトを超えるデータを生成していることをご存知ですか?このペースのデータ生成が、次のようなハイエンドテクノロジーの人気の背後にある理由です。 データサイエンス 、 、 等々。
データから有用な洞察を引き出すことは、データサイエンスと呼ばれるものです。データサイエンスには、大量のデータの抽出、処理、分析が含まれます。現在必要なのは これは、この膨大な量のデータを保存および管理するために使用できます。
SQLを使用すると、データサイエンスのプロセス全体をよりスムーズに実行するために、大量のデータを保存、アクセス、および抽出できます。
SQLとは何ですか?
SQL 構造化照会言語の略で、リレーショナルデータベースの管理を目的とした照会言語です。
しかし、リレーショナルデータベースとは正確には何ですか?
リレーショナルデータベースは、データベーステーブルを変更することなく、データにアクセス、編集、更新などできる、明確に定義されたテーブルのグループです。 SQLは、リレーショナルデータベースの標準(API)です。
SQLに戻ると、SQLプログラミングを使用して、データベースレコードのクエリ、挿入、更新、削除など、データに対して複数のアクションを実行できます。 SQLを使用するリレーショナルデータベースの例には、MySQLデータベース、Oracleなどがあります。
HTMLのbrタグとは
SQLのデモを始める前に、基本的なSQLコマンドについて理解しましょう。
SQLの基礎
SQLには、データテーブルを変更するための一連の簡単なコマンドが用意されています。基本的なSQLコマンドのいくつかを見ていきましょう。
- データベースの作成– 新しいデータベースを作成します
- CREATE TABLE – 新しいテーブルを作成します
- 挿入– データベースに新しいデータを挿入します
- 選択する - データベースからデータを抽出します
- 更新– データベース内のデータを更新します
- 削除– データベースからデータを削除します
- ALTER DATABASE – データベースを変更します
- 他の机 - テーブルを変更します
- ドロップテーブル– テーブルを削除します
- インデックスの作成– 要素を検索するためのインデックスを作成します
- ドロップインデックス– 削除します インデックス
SQLをよりよく理解するために、MySQLをインストールして、データを操作する方法を見てみましょう。
MySQLのインストール
MySQLのインストールは簡単な作業です。これが ステップバイステップガイド これは、MySQLをシステムにインストールするのに役立ちます。
インストールが完了したら MySQL、以下のセクションに従って、データを挿入、操作、および変更する方法を示す簡単なデモをご覧ください。
SQL For Data Science –MySQLデモ
このデモンストレーションでは、データベースを作成して処理する方法を説明します。これは、SQLのデータ分析を開始するための初心者レベルのデモンストレーションです。
それでは始めましょう!
ステップ1:SQLデータベースを作成する
SQLデータベースは、データを構造化された形式で格納できるストレージウェアハウスです。それでは、を使用してデータベースを作成しましょう MySQL :
CREATE DATABASE edureka USE edureka
上記のコードには、2つのSQLコマンドがあります。
注意 :SQLコマンドは大文字で定義され、セミコロンはSQLコマンドを終了するために使用されます。
CREATE DATABASE:このコマンドは、「edureka」というデータベースを作成します
使用:このコマンドは、データベースをアクティブ化するために使用されます。ここでは、「edureka」データベースをアクティブ化しています。
ステップ2:必要なデータ機能を備えたテーブルを作成する
テーブルの作成は、データベースの作成と同じくらい簡単です。テーブルの変数または機能をそれぞれのデータ型で定義する必要があります。これを行う方法を見てみましょう。
CREATE TABLEおもちゃ(TID INTEGER NOT NULL PRIMARY KEY AUTO_INCREMENT、Item_name TEXT、Price INTEGER、Quantity INTEGER)
上記のコードスニペットでは、次のことが発生します。
- 「CREATETABLE」コマンドを使用して、おもちゃと呼ばれるテーブルを作成します。
- おもちゃのテーブルには、TID(トランザクションID)、Item_name、Price、Quantityの4つの機能が含まれています。
- 各変数は、それぞれのデータ型で定義されます。
- TID変数は主キーとして宣言されています。主キーは基本的に、一意の値を格納できる変数を示します。
次のコマンドを使用して、定義されたテーブルの詳細をさらに確認できます。
DESCRIBEおもちゃ
ステップ3:テーブルにデータを挿入する
テーブルを作成したので、いくつかの値を入力してみましょう。このブログの前半で、単一のコマンド、つまりINSERTINTOを使用してデータをテーブルに追加する方法について説明しました。
これがどのように行われるか見てみましょう。
INSERT INTO toys VALUES(NULL、 'Train'、550、88)INSERT INTO toys VALUES(NULL、 'Hotwheels_car'、350、80)INSERT INTO toys VALUES(NULL、 'Magic_Pencil'、70、100)INSERT INTO toys VALUES( NULL、 'Dog_house'、120、54)INSERT INTO toys VALUES(NULL、 'Skateboard'、700、42)INSERT INTO toys VALUES(NULL、 'GI Joe'、300、120)
上記のコードスニペットでは、INSERT INTOコマンドを使用して、6つの観測値を「おもちゃ」テーブルに挿入しただけです。観測ごとに、括弧内に、テーブルの作成中に定義された各変数または機能の値を指定しました。
TID変数は1から自動インクリメントされるため、NULLに設定されます。
次に、テーブルに存在するすべてのデータを表示しましょう。これは、以下のコマンドを使用して実行できます。
SELECT * FROMおもちゃ
ステップ4:データエントリを変更する
G.I.の価格を上げることにしたとしましょう。ジョーはあなたにたくさんの顧客を獲得しているので。データベース内の変数の価格をどのように更新しますか?
python__init__クラス
簡単です。次のコマンドを使用するだけです。
おもちゃの更新SET価格= 350 WHERE TID = 6
UPDATEコマンドを使用すると、テーブルに格納されている値/変数を変更できます。 SETパラメーターを使用すると、特定の機能を選択でき、WHEREパラメーターを使用して、変更する変数/値を識別します。上記のコマンドで、TIDが6(G.I。Joe)のデータエントリの価格を更新しました。
次に、更新されたテーブルを表示します。
SELECT * FROMおもちゃ
表示したい列を参照するだけで、表示したいものを変更することもできます。たとえば、次のコマンドは、おもちゃの名前とそれぞれの価格のみを表示します。
SELECT Item_name、Price FROM toys
ステップ5:データを取得する
したがって、データを挿入して変更した後、ビジネス要件に従ってデータを抽出および取得するときがやっとです。これは、さらなるデータ分析とデータモデリングのためにデータを取得できる場所です。
これはSQLを使い始めるための簡単な例ですが、実際のシナリオでは、データははるかに複雑でサイズが大きいことに注意してください。それにもかかわらず、SQLコマンドは同じままであり、それがSQLを非常にシンプルで理解しやすいものにしている理由です。一連の単純なSQLコマンドを使用して複雑なデータセットを処理できます。
それでは、いくつかの変更を加えてデータを取得しましょう。以下のコードを参照して、出力を見ずにそれが何をするのかを理解してみてください。
SELECT * FROMおもちゃLIMIT2
当たってるよ!テーブルに存在する最初の2つの観測値が表示されます。
もっと面白いことを試してみましょう。
SELECT * FROM toys ORDER BY Price ASC
図に示すように、値は価格変数の昇順で配置されています。最も頻繁に購入される3つのアイテムを探したい場合は、どうしますか?
とても簡単です!
doubleからintjavaに変換します
SELECT * FROMおもちゃORDERBY数量DESCLIMIT 3
もう1つ試してみましょう。
SELECT * FROMおもちゃWHERE価格> 400 ORDERBY価格ASC
このクエリは、価格が400を超えるおもちゃの詳細を抽出し、価格の昇順で出力を並べ替えます。
これが、SQLを使用してデータを処理する方法です。 SQL for Data Scienceの基本を理解したので、さらに詳しく知りたいと思っていると思います。始めるためのブログをいくつか紹介します。
人工知能と機械学習の完全なコースに登録したい場合は、Edurekaが特別にキュレーションします これにより、教師あり学習、教師なし学習、自然言語処理などのテクニックに習熟できます。ディープラーニング、グラフィカルモデル、強化学習など、人工知能と機械学習の最新の進歩と技術的アプローチに関するトレーニングが含まれています。