SQL For Data Science:初心者向けのワンストップソリューション



SQL for Data Scienceに関するこのブログ投稿は、SQLを使用してデータを保存、アクセス、取得してデータ分析を実行する方法を理解するのに役立ちます。

データサイエンスがその時代の最も有望な仕事であるとして1位にランクされていたので、私たちは皆、次のレースに参加しようとしています。 。 SQL for Data Scienceに関するこのブログ投稿は、SQLを使用してデータを保存、アクセス、取得してデータ分析を実行する方法を理解するのに役立ちます。

これが予定されているトピックのリストです このブログで取り上げられています:





    1. データサイエンスにSQLが必要なのはなぜですか?
    2. SQLとは何ですか?
    3. SQLの基礎
    4. MySQLのインストール
    5. ハンズオン

データサイエンスにSQLが必要なのはなぜですか?

毎日2.5兆バイトを超えるデータを生成していることをご存知ですか?このペースのデータ生成が、次のようなハイエンドテクノロジーの人気の背後にある理由です。 データサイエンス 、 、 等々。

データから有用な洞察を引き出すことは、データサイエンスと呼ばれるものです。データサイエンスには、大量のデータの抽出、処理、分析が含まれます。現在必要なのは これは、この膨大な量のデータを保存および管理するために使用できます。



データサイエンスとは-Edureka

ここが SQLが登場します。

SQLを使用すると、データサイエンスのプロセス全体をよりスムーズに実行するために、大量のデータを保存、アクセス、および抽出できます。



SQLとは何ですか?

SQL 構造化照会言語の略で、リレーショナルデータベースの管理を目的とした照会言語です。

しかし、リレーショナルデータベースとは正確には何ですか?

リレーショナルデータベースは、データベーステーブルを変更することなく、データにアクセス、編集、更新などできる、明確に定義されたテーブルのグループです。 SQLは、リレーショナルデータベースの標準(API)です。

SQLに戻ると、SQLプログラミングを使用して、データベースレコードのクエリ、挿入、更新、削除など、データに対して複数のアクションを実行できます。 SQLを使用するリレーショナルデータベースの例には、MySQLデータベース、Oracleなどがあります。

SQLの詳細については、 次のブログ:

HTMLのbrタグとは
  1. SQLデータ型を理解する–SQLデータ型について知る必要があるすべて
  2. SQLでのCREATETABLE –SQLでのテーブルの作成について知っておくべきことすべて

SQLのデモを始める前に、基本的なSQLコマンドについて理解しましょう。

SQLの基礎

SQLには、データテーブルを変更するための一連の簡単なコマンドが用意されています。基本的なSQLコマンドのいくつかを見ていきましょう。

  • データベースの作成– 新しいデータベースを作成します
  • CREATE TABLE – 新しいテーブルを作成します
  • 挿入– データベースに新しいデータを挿入します
  • 選択する - データベースからデータを抽出します
  • 更新– データベース内のデータを更新します
  • 削除– データベースからデータを削除します
  • ALTER DATABASE – データベースを変更します
  • 他の机 - テーブルを変更します
  • ドロップテーブル– テーブルを削除します
  • インデックスの作成– 要素を検索するためのインデックスを作成します
  • ドロップインデックス– 削除します インデックス

SQLをよりよく理解するために、MySQLをインストールして、データを操作する方法を見てみましょう。

MySQLのインストール

MySQLのインストールは簡単な作業です。これが ステップバイステップガイド これは、MySQLをシステムにインストールするのに役立ちます。

インストールが完了したら MySQL、以下のセクションに従って、データを挿入、操作、および変更する方法を示す簡単なデモをご覧ください。

SQL For Data Science –MySQLデモ

このデモンストレーションでは、データベースを作成して処理する方法を説明します。これは、SQLのデータ分析を開始するための初心者レベルのデモンストレーションです。

それでは始めましょう!

ステップ1:SQLデータベースを作成する

SQLデータベースは、データを構造化された形式で格納できるストレージウェアハウスです。それでは、を使用してデータベースを作成しましょう MySQL

CREATE DATABASE edureka USE edureka

上記のコードには、2つのSQLコマンドがあります。

注意 :SQLコマンドは大文字で定義され、セミコロンはSQLコマンドを終了するために使用されます。

  1. CREATE DATABASE:このコマンドは、「edureka」というデータベースを作成します

  2. 使用:このコマンドは、データベースをアクティブ化するために使用されます。ここでは、「edureka」データベースをアクティブ化しています。

ステップ2:必要なデータ機能を備えたテーブルを作成する

テーブルの作成は、データベースの作成と同じくらい簡単です。テーブルの変数または機能をそれぞれのデータ型で定義する必要があります。これを行う方法を見てみましょう。

CREATE TABLEおもちゃ(TID INTEGER NOT NULL PRIMARY KEY AUTO_INCREMENT、Item_name TEXT、Price INTEGER、Quantity INTEGER)

上記のコードスニペットでは、次のことが発生します。

  1. 「CREATETABLE」コマンドを使用して、おもちゃと呼ばれるテーブルを作成します。
  2. おもちゃのテーブルには、TID(トランザクションID)、Item_name、Price、Quantityの4つの機能が含まれています。
  3. 各変数は、それぞれのデータ型で定義されます。
  4. TID変数は主キーとして宣言されています。主キーは基本的に、一意の値を格納できる変数を示します。

次のコマンドを使用して、定義されたテーブルの詳細をさらに確認できます。

DESCRIBEおもちゃ

ステップ3:テーブルにデータを挿入する

テーブルを作成したので、いくつかの値を入力してみましょう。このブログの前半で、単一のコマンド、つまりINSERTINTOを使用してデータをテーブルに追加する方法について説明しました。

これがどのように行われるか見てみましょう。

INSERT INTO toys VALUES(NULL、 'Train'、550、88)INSERT INTO toys VALUES(NULL、 'Hotwheels_car'、350、80)INSERT INTO toys VALUES(NULL、 'Magic_Pencil'、70、100)INSERT INTO toys VALUES( NULL、 'Dog_house'、120、54)INSERT INTO toys VALUES(NULL、 'Skateboard'、700、42)INSERT INTO toys VALUES(NULL、 'GI Joe'、300、120)

上記のコードスニペットでは、INSERT INTOコマンドを使用して、6つの観測値を「おもちゃ」テーブルに挿入しただけです。観測ごとに、括弧内に、テーブルの作成中に定義された各変数または機能の値を指定しました。

TID変数は1から自動インクリメントされるため、NULLに設定されます。

次に、テーブルに存在するすべてのデータを表示しましょう。これは、以下のコマンドを使用して実行できます。

SELECT * FROMおもちゃ


ステップ4:データエントリを変更する

G.I.の価格を上げることにしたとしましょう。ジョーはあなたにたくさんの顧客を獲得しているので。データベース内の変数の価格をどのように更新しますか?

python__init__クラス

簡単です。次のコマンドを使用するだけです。

おもちゃの更新SET価格= 350 WHERE TID = 6

UPDATEコマンドを使用すると、テーブルに格納されている値/変数を変更できます。 SETパラメーターを使用すると、特定の機能を選択でき、WHEREパラメーターを使用して、変更する変数/値を識別します。上記のコマンドで、TIDが6(G.I。Joe)のデータエントリの価格を更新しました。

次に、更新されたテーブルを表示します。

SELECT * FROMおもちゃ

表示したい列を参照するだけで、表示したいものを変更することもできます。たとえば、次のコマンドは、おもちゃの名前とそれぞれの価格のみを表示します。

SELECT Item_name、Price FROM toys

ステップ5:データを取得する

したがって、データを挿入して変更した後、ビジネス要件に従ってデータを抽出および取得するときがやっとです。これは、さらなるデータ分析とデータモデリングのためにデータを取得できる場所です。

これはSQLを使い始めるための簡単な例ですが、実際のシナリオでは、データははるかに複雑でサイズが大きいことに注意してください。それにもかかわらず、SQLコマンドは同じままであり、それがSQLを非常にシンプルで理解しやすいものにしている理由です。一連の単純なSQLコマンドを使用して複雑なデータセットを処理できます。

それでは、いくつかの変更を加えてデータを取得しましょう。以下のコードを参照して、出力を見ずにそれが何をするのかを理解してみてください。

SELECT * FROMおもちゃLIMIT2

当たってるよ!テーブルに存在する最初の2つの観測値が表示されます。

もっと面白いことを試してみましょう。

SELECT * FROM toys ORDER BY Price ASC

図に示すように、値は価格変数の昇順で配置されています。最も頻繁に購入される3つのアイテムを探したい場合は、どうしますか?

とても簡単です!

doubleからintjavaに変換します
SELECT * FROMおもちゃORDERBY数量DESCLIMIT 3

もう1つ試してみましょう。

SELECT * FROMおもちゃWHERE価格> 400 ORDERBY価格ASC


このクエリは、価格が400を超えるおもちゃの詳細を抽出し、価格の昇順で出力を並べ替えます。

これが、SQLを使用してデータを処理する方法です。 SQL for Data Scienceの基本を理解したので、さらに詳しく知りたいと思っていると思います。始めるためのブログをいくつか紹介します。

  1. データサイエンスとは何ですか?データサイエンスの初心者向けガイド
  2. MySQLチュートリアル–MySQLを学ぶための初心者向けガイド

人工知能と機械学習の完全なコースに登録したい場合は、Edurekaが特別にキュレーションします これにより、教師あり学習、教師なし学習、自然言語処理などのテクニックに習熟できます。ディープラーニング、グラフィカルモデル、強化学習など、人工知能と機械学習の最新の進歩と技術的アプローチに関するトレーニングが含まれています。