アナコンダは、データサイエンティスト、ITプロフェッショナル、そして明日のビジネスリーダーのためのデータサイエンスプラットフォームです。の配布です Python 、 R など。300以上のパッケージで 、それはあらゆるプロジェクトに最適なプラットフォームの1つになります。これで anacondaチュートリアルでは、Pythonプログラミングにanacondaを使用する方法について説明します。このブログで説明されているトピックは次のとおりです。
Anacondaの紹介
Anacondaは、PythonとRのオープンソースディストリビューションです。 データサイエンス 、 、 ディープラーニング など。データサイエンス用に300を超えるライブラリが利用できるため、プログラマーがデータサイエンス用のanacondaに取り組むことはかなり最適になります。
Anacondaは、パッケージの管理と展開を簡素化するのに役立ちます。 Anacondaには、さまざまな機械学習とAIアルゴリズムを使用して、さまざまなソースからデータを簡単に収集するためのさまざまなツールが付属しています。これは、ボタンを1つクリックするだけで任意のプロジェクトを展開できる、管理が容易な環境設定を取得するのに役立ちます。
anacondaとは何かがわかったので、anacondaをインストールして、システムで動作する環境をセットアップする方法を理解してみましょう。
インストールとセットアップ
anacondaをインストールするには、 https://www.anaconda.com/distribution/ 。
あなたに適したバージョンを選択し、ダウンロードをクリックしてください。ダウンロードが完了したら、セットアップを開きます。
セットアップの指示に従います。パス環境変数にanacondaを追加するをクリックすることを忘れないでください。インストールが完了すると、下の画像のようなウィンドウが表示されます。
インストールが完了したら、anacondaプロンプトを開き、次のように入力します 。
Informaticaでの変換のタイプ
下の画像のようなウィンドウが表示されます。
Pythonでanacondaを使用する方法がわかったので、プロジェクトのanacondaにさまざまなライブラリをインストールする方法を見てみましょう。
AnacondaにPythonライブラリをインストールする方法は?
anacondaプロンプトを開き、ライブラリがすでにインストールされているかどうかを確認します。
numpyという名前のモジュールが存在しないため、次のコマンドを実行してnumpyをインストールします。
インストールが完了すると、画像に示されているウィンドウが表示されます。
ライブラリをインストールしたら、保証のためにモジュールを再度インポートしてみてください。
ご覧のとおり、最初に発生したエラーはないので、これがanacondaにさまざまなライブラリをインストールする方法です。
アナコンダナビゲーター
Anaconda Navigatorは、anacondaディストリビューションに付属するデスクトップGUIです。これにより、コマンドラインコマンドを使用せずに、アプリケーションを起動し、condaパッケージ、環境を管理できます。
ユースケース–Pythonの基礎
変数とデータ型
変数とデータ型 プログラミング言語の構成要素です。 Pythonには、所有するプロパティに応じて6つのデータ型があります。リスト、辞書、セット、タプルは、Pythonプログラミング言語のコレクションデータ型です。
Javaで数値を逆にする方法
以下は、Pythonで変数とデータ型がどのように使用されるかを示す例です。
#variable宣言名= 'Edureka' f = 1991 print( 'python found in'、f)#data types a = [1,2,3,4,5,6,7] b = {1: 'edureka' 、2: 'python'} c =(1,2,3,4,5)d = {1,2,3,4,5} print( 'リストは'、a)print( '辞書は' 、b)print( 'タプルは'、c)print( 'セットは'、d)
演算子
Pythonの演算子 値または変数間の操作に使用されます。 Pythonには7種類の演算子があります。
- 代入演算子
- 算術演算子
- 論理演算子
- 比較演算子
- ビット単位の演算子
- メンバーシップオペレーター
- アイデンティティ演算子
以下は、Pythonでいくつかの演算子を使用した例です。
a = 10 b = 15#算術演算子print(a + b)print(a --b)print(a * b)#代入演算子a + = 10 print(a)#比較演算子#a!= 10 #b == a#論理演算子a> bおよびa> 10 #thisは、両方のステートメントがtrueの場合にtrueを返します。
制御ステートメント
次のようなステートメント 、break、continueは、最適な結果を得るために実行を制御するための制御ステートメントとして使用されます。これらのステートメントをPythonのさまざまなループで使用して、結果を制御できます。以下は、制御ステートメントと条件ステートメントを操作する方法を示す例です。
name = 'edureka' for i in name:if i == 'a':break else:print(i)
機能
効率的な方法でコードの再利用性を提供します。問題ステートメントのロジックを記述し、いくつかの引数を実行して最適なソリューションを取得できます。以下は、Pythonで関数を使用する方法の例です。
def func(a):** a res = func(10)print(res)を返します
クラスとオブジェクト
Pythonはオブジェクト指向プログラミングをサポートしているので、 クラスとオブジェクト 同じように。以下は、Pythonでクラスとオブジェクトを操作する方法の例です。
class Parent:def func(self):print( 'this is parent')class Child(Parent):def func1(self):print( 'this is child')ob = new Child()ob.func()
これらは、Pythonの基本的な概念です。ここで、anacondaでのより大きなパッケージのサポートについて説明しますが、多くのライブラリを操作できます。データ分析にPythonanacondaを使用する方法を見てみましょう。
ユースケース–分析
これらはに含まれる特定のステップです 。アナコンダと私たちが使用できるさまざまなライブラリでデータ分析がどのように機能するかを見てみましょう。
データの収集
ザ・ データの収集 プログラムにCSVファイルをロードするのと同じくらい簡単です。次に、関連するデータを利用して、データ内の特定のインスタンスまたはエントリを分析できます。以下は、CSVデータをプログラムにロードするためのコードです。
pdとしてパンダをインポートnpとしてnumpyをインポートインポートpltとしてmatplotlib.pyplotをインポートsnsとしてseabornをインポートdf = pd.read_csv( 'filename.csv')print(df.head(5))
スライスとダイシング
プログラムにデータセットをロードした後、分析のあいまいさを引き起こす可能性のあるnull値や不要なフィールドを削除するなど、いくつかの変更を加えてデータをフィルタリングする必要があります。
以下は、要件に従ってデータをフィルタリングする方法の例です。
print(df.isnull()。sum())#これにより、データセット内のすべてのnull値の合計が得られます。 df1 = df.dropna(axis = 0、how = 'any')#これにより、null値の行が削除されます。
null値を削除することもできます。
箱ひげ図
sns.boxplot(x = df ['Salary Range From'])sns.boxplot(x = df ['Salary Range To'])
散布図
C ++の例での関数のオーバーロード
matplotlib.pyplotをpltfigとしてインポートします。ax= plt.subplots(figsize =(16,8))ax.scatter(df ['Salary Range From']、df ['Salary Range To'])ax.set_xlabel( 'Salary Range From ')ax.set_ylabel(' Salary Range TO ')plt.show()
視覚化
要件に応じてデータを変更したら、このデータを分析する必要があります。これを行うそのような方法の1つは、結果を視覚化することです。より良い データ予測の最適な分析に役立ちます。
以下は、データを視覚化する例です。
sns.countplot(x = 'フルタイム/パートタイムインジケーター'、data = df)sns.countplot(x = 'フルタイム/パートタイムインジケーター'、hue = '給与頻度'、data = df)sns .countplot(hue = 'フルタイム/パートタイムインジケーター'、x = '投稿タイプ'、data = df)df ['Salary Range From']。plot.hist()df ['Salary RangeTo']。 plot.hist()
matplotlib.pyplotをpltとしてインポートfig = plt.figure(figsize =(10,10))ax = fig.gca()sns.heatmap(df1.corr()、annot = True、fmt = '。2f')plt。 title( 'Correlation'、fontsize = 5)plt.show()
分析
視覚化した後、さまざまなプロットやグラフを見て分析を行うことができます。ある地域の特定の仕事の視覚的表現を見ることで、特定のドメインの仕事の数を知ることができる、仕事のデータに取り組んでいると仮定します。
上記の分析から、次の結果が推測できます。
- データセット内のパートタイムの仕事の数は、フルタイムの仕事と比較して非常に少ないです。
- パートタイムの仕事は500人未満ですが、フルタイムの仕事は2500人以上です。
- この分析に基づいて、 予測モデル。
このpythonanacondaチュートリアルでは、pythonの基礎、データ分析、機械学習をカバーするユースケースを使用して、python用にanacondaをセットアップする方法を理解しました。データサイエンス用の300以上のパッケージを備えたアナコンダは、効率的な結果で最適なサポートを提供します。 Pythonのスキルを習得するには、Edurekaに登録してください 学習を開始します。
何か質問がある? 「pythonanacondaチュートリアル」に関するこの記事のコメントでそれらについて言及してください。できるだけ早くご連絡いたします。