データサイエンスのためのSQL | SQLとデータサイエンスの概要|エドゥレカ

データサイエンスがその時代の最も有望な仕事であるとして1位にランクされていたので、私たちは皆、次のレースに参加しようとしています。。 SQL for Data Scienceに関するこのブログ投稿は、SQLを使用してデータを保存、アクセス、取得してデータ分析を実行する方法を理解するのに役立ちます。

これが予定されているトピックのリストですこのブログで取り上げられています：

データサイエンスにSQLが必要なのはなぜですか？

毎日2.5兆バイトを超えるデータを生成していることをご存知ですか？このペースのデータ生成が、次のようなハイエンドテクノロジーの人気の背後にある理由です。データサイエンス、、等々。

データから有用な洞察を引き出すことは、データサイエンスと呼ばれるものです。データサイエンスには、大量のデータの抽出、処理、分析が含まれます。現在必要なのはこれは、この膨大な量のデータを保存および管理するために使用できます。

データサイエンスとは-Edureka

ここが SQLが登場します。

SQLを使用すると、データサイエンスのプロセス全体をよりスムーズに実行するために、大量のデータを保存、アクセス、および抽出できます。

SQLとは何ですか？

SQL 構造化照会言語の略で、リレーショナルデータベースの管理を目的とした照会言語です。

しかし、リレーショナルデータベースとは正確には何ですか？

リレーショナルデータベースは、データベーステーブルを変更することなく、データにアクセス、編集、更新などできる、明確に定義されたテーブルのグループです。 SQLは、リレーショナルデータベースの標準（API）です。

SQLに戻ると、SQLプログラミングを使用して、データベースレコードのクエリ、挿入、更新、削除など、データに対して複数のアクションを実行できます。 SQLを使用するリレーショナルデータベースの例には、MySQLデータベース、Oracleなどがあります。

SQLの詳細については、次のブログ：

HTMLのbrタグとは

SQLのデモを始める前に、基本的なSQLコマンドについて理解しましょう。

SQLの基礎

SQLには、データテーブルを変更するための一連の簡単なコマンドが用意されています。基本的なSQLコマンドのいくつかを見ていきましょう。

データベースの作成– 新しいデータベースを作成します
CREATE TABLE – 新しいテーブルを作成します
挿入– データベースに新しいデータを挿入します
選択する - データベースからデータを抽出します
更新– データベース内のデータを更新します
削除– データベースからデータを削除します
ALTER DATABASE – データベースを変更します
他の机 - テーブルを変更します
ドロップテーブル– テーブルを削除します
インデックスの作成– 要素を検索するためのインデックスを作成します
ドロップインデックス– 削除しますインデックス

SQLをよりよく理解するために、MySQLをインストールして、データを操作する方法を見てみましょう。

MySQLのインストール

MySQLのインストールは簡単な作業です。これがステップバイステップガイドこれは、MySQLをシステムにインストールするのに役立ちます。

インストールが完了したら MySQL、以下のセクションに従って、データを挿入、操作、および変更する方法を示す簡単なデモをご覧ください。

SQL For Data Science –MySQLデモ

このデモンストレーションでは、データベースを作成して処理する方法を説明します。これは、SQLのデータ分析を開始するための初心者レベルのデモンストレーションです。

それでは始めましょう！

ステップ1：SQLデータベースを作成する

SQLデータベースは、データを構造化された形式で格納できるストレージウェアハウスです。それでは、を使用してデータベースを作成しましょう MySQL ：

CREATE DATABASE edureka USE edureka

上記のコードには、2つのSQLコマンドがあります。

注意：SQLコマンドは大文字で定義され、セミコロンはSQLコマンドを終了するために使用されます。

CREATE DATABASE：このコマンドは、「edureka」というデータベースを作成します
使用：このコマンドは、データベースをアクティブ化するために使用されます。ここでは、「edureka」データベースをアクティブ化しています。

ステップ2：必要なデータ機能を備えたテーブルを作成する

テーブルの作成は、データベースの作成と同じくらい簡単です。テーブルの変数または機能をそれぞれのデータ型で定義する必要があります。これを行う方法を見てみましょう。

CREATE TABLEおもちゃ（TID INTEGER NOT NULL PRIMARY KEY AUTO_INCREMENT、Item_name TEXT、Price INTEGER、Quantity INTEGER）

上記のコードスニペットでは、次のことが発生します。

「CREATETABLE」コマンドを使用して、おもちゃと呼ばれるテーブルを作成します。
おもちゃのテーブルには、TID（トランザクションID）、Item_name、Price、Quantityの4つの機能が含まれています。
各変数は、それぞれのデータ型で定義されます。
TID変数は主キーとして宣言されています。主キーは基本的に、一意の値を格納できる変数を示します。

次のコマンドを使用して、定義されたテーブルの詳細をさらに確認できます。

DESCRIBEおもちゃ

ステップ3：テーブルにデータを挿入する

テーブルを作成したので、いくつかの値を入力してみましょう。このブログの前半で、単一のコマンド、つまりINSERTINTOを使用してデータをテーブルに追加する方法について説明しました。

これがどのように行われるか見てみましょう。

INSERT INTO toys VALUES（NULL、 'Train'、550、88）INSERT INTO toys VALUES（NULL、 'Hotwheels_car'、350、80）INSERT INTO toys VALUES（NULL、 'Magic_Pencil'、70、100）INSERT INTO toys VALUES（ NULL、 'Dog_house'、120、54）INSERT INTO toys VALUES（NULL、 'Skateboard'、700、42）INSERT INTO toys VALUES（NULL、 'GI Joe'、300、120）

上記のコードスニペットでは、INSERT INTOコマンドを使用して、6つの観測値を「おもちゃ」テーブルに挿入しただけです。観測ごとに、括弧内に、テーブルの作成中に定義された各変数または機能の値を指定しました。

TID変数は1から自動インクリメントされるため、NULLに設定されます。

次に、テーブルに存在するすべてのデータを表示しましょう。これは、以下のコマンドを使用して実行できます。

SELECT * FROMおもちゃ

ステップ4：データエントリを変更する

G.I.の価格を上げることにしたとしましょう。ジョーはあなたにたくさんの顧客を獲得しているので。データベース内の変数の価格をどのように更新しますか？

python__init__クラス

簡単です。次のコマンドを使用するだけです。

おもちゃの更新SET価格= 350 WHERE TID = 6

UPDATEコマンドを使用すると、テーブルに格納されている値/変数を変更できます。 SETパラメーターを使用すると、特定の機能を選択でき、WHEREパラメーターを使用して、変更する変数/値を識別します。上記のコマンドで、TIDが6（G.I。Joe）のデータエントリの価格を更新しました。

次に、更新されたテーブルを表示します。

SELECT * FROMおもちゃ

表示したい列を参照するだけで、表示したいものを変更することもできます。たとえば、次のコマンドは、おもちゃの名前とそれぞれの価格のみを表示します。

SELECT Item_name、Price FROM toys

ステップ5：データを取得する

したがって、データを挿入して変更した後、ビジネス要件に従ってデータを抽出および取得するときがやっとです。これは、さらなるデータ分析とデータモデリングのためにデータを取得できる場所です。

これはSQLを使い始めるための簡単な例ですが、実際のシナリオでは、データははるかに複雑でサイズが大きいことに注意してください。それにもかかわらず、SQLコマンドは同じままであり、それがSQLを非常にシンプルで理解しやすいものにしている理由です。一連の単純なSQLコマンドを使用して複雑なデータセットを処理できます。

それでは、いくつかの変更を加えてデータを取得しましょう。以下のコードを参照して、出力を見ずにそれが何をするのかを理解してみてください。

SELECT * FROMおもちゃLIMIT2

当たってるよ！テーブルに存在する最初の2つの観測値が表示されます。

もっと面白いことを試してみましょう。

SELECT * FROM toys ORDER BY Price ASC

図に示すように、値は価格変数の昇順で配置されています。最も頻繁に購入される3つのアイテムを探したい場合は、どうしますか？

とても簡単です！

doubleからintjavaに変換します

SELECT * FROMおもちゃORDERBY数量DESCLIMIT 3

もう1つ試してみましょう。

SELECT * FROMおもちゃWHERE価格> 400 ORDERBY価格ASC

このクエリは、価格が400を超えるおもちゃの詳細を抽出し、価格の昇順で出力を並べ替えます。

これが、SQLを使用してデータを処理する方法です。 SQL for Data Scienceの基本を理解したので、さらに詳しく知りたいと思っていると思います。始めるためのブログをいくつか紹介します。

人工知能と機械学習の完全なコースに登録したい場合は、Edurekaが特別にキュレーションしますこれにより、教師あり学習、教師なし学習、自然言語処理などのテクニックに習熟できます。ディープラーニング、グラフィカルモデル、強化学習など、人工知能と機械学習の最新の進歩と技術的アプローチに関するトレーニングが含まれています。

SQL For Data Science：初心者向けのワンストップソリューション

SQL for Data Scienceに関するこのブログ投稿は、SQLを使用してデータを保存、アクセス、取得してデータ分析を実行する方法を理解するのに役立ちます。

データサイエンスにSQLが必要なのはなぜですか？

SQLとは何ですか？

SQLの基礎

MySQLのインストール

カテゴリー

Popular Articles

Sparkでのパーティショニングの謎を解き明かす

JavaのEJBとは何ですか？それを実装する方法は？

機械学習のキャリアと将来の範囲

DevOpsを学ぶべきトップ10の理由–DevOpsを学ぶ理由

イーサリアムプライベートネットワーク–独自のイーサリアムブロックチェーンを作成してください！

データ視覚化のニーズと利点

YouTubeの力を発見する：100万人のYouTubeチャンネル登録者へのEdurekaの旅

HTMLの「a」タグについて知っておくべきことすべて

Angular8のNgStyleについて知っておくべきことすべて

動的メモリ割り当てC ++を使用する方法は？

DevOpsのLinuxコマンド：すべてのDevOpsProfessionalについて知っておく必要があります

HBaseストレージアーキテクチャの概要