Microsoft SQL Server Management Studioの簡単な操作をしますので、徐々に慣れていきましょう。
本ページでは、データベース、テーブルの作成を行います。
Microsoft SQL Server Management Studioの起動
「スタート」→「Microsoft SQL Server Management Studio」を選択します。
サーバーに接続する
サーバー名を入力して「接続」ボタンを選択します。
サーバー名はデフォルトはコンピューター名になっていますので、Windows認証のユーザー名の「¥」より左を入れればOKです。
データベースを作る
エラーなく以下のような画面が出れば、サーバー(ローカルPC)に接続できたことが確認できます。
オブジェクトエクスプローラー内の、データベースのプラスボタンを選択し、データベースを確認します。
この段階では、デフォルトのデータベースしか存在していません。
簡易的なデータベースを作成しましょう。
「データベース」を右クリックし「新しいデータベース」を選択します。
データベース名に「tech_datalake」を入力します。
(任意の名前で構いません。以降はご自身で設定したデータベース名で置き換えてください)
次に、論理名「tech_datalake」の行データの初期サイズ(MB)が8になっているので、10000(10GB)に変更し、OKボタンを選択します。
※大きなデータは扱わないので多めに取って10GBにしていますが、ご自身のPCの空き容量に合わせて適宜初期サイズを設定して問題ありません。
すると「tech_datalake」のデータベースが作成されたことを確認できます。
テーブルを作る
データベース「tech_dataleke」のプラスボタン→テーブルのプラスボタンを選択します。
こちらもデフォルトのままですので、新規にテーブルを作成します。
データの準備
今回はe-Statにある「年齢(5歳階級),男女別人口-都道府県(大正9年~平成27年)」の国勢調査データを用いてテーブルを
e-Statは日本の統計データや、統計情報が閲覧できる政府統計ポータルサイトです。
興味がある方は、ぜひ参照してみてください。
以下リンクをクリックします。
https://www.e-stat.go.jp/stat-search/files?page=1&layout=datalist&toukei=00200521&tstat=000001011777&cycle=0&tclass1=000001094741&stat_infid=000031523105&tclass2val=0
リンク先の表示ダウンロードボタンを選択しダウンロードします。
同じページにデータの概要があるので、ざっくりとしていますがこちらも併せて確認しておきしょう。
実業務だとテーブル定義書などからデータの概要、各項目や型、桁などが確認できるかと思います。
データの確認
ダウンロードしたデータを任意のテキストエディタで開いて確認します。
私はサクラエディタをよく使っています。
実際データを確認すると、以下がわかります。
テーブル作成の際に必要な情報ですので確認しましょう。
- ファイル拡張子が「csv」、各データの区切り文字も「カンマ」。
レアケースですが拡張子がcsvにもかかわらず区切り文字が「タブ」となる場合もあるので必ず確認するようにしましょう。 - 1行目がヘッダー、2行目以降が実データです。
- 改行コードは「CRLF」です。
- 文字コードは「SJIS」です。
今回は、SQL Server Management Studio操作がメインなので、インポート機能を使ってサクッとテーブルを作成します。
本手順は、手動で作ったデータでテーブル定義がない場合にとりあえずテーブル化してデータの中身を確認したい、SQLの挙動確認のためcsvデータを作ってテーブル化するなど実業務でも使う場面があります。
テーブルを作成してみよう
tech_datalakeを右クリック→タスク→データのインポートを選択します。
ウィザードが立ち上がるので、「Next」を選択します。
執筆時点で日本語がうまく適用できていないようですが、いったん無視しましょう。
データソースから、「Flat File Source」を選択します。
選択肢が他にもありますが、今回はプレーンなcsvデータなので上記を選択します。
デフォルトは「テキストファイル」になっているためcsvファイルは表示されません。
「すべてのファイル」をに変更します。
c03.csvを選択し、「開く」を選択します。
コードページが「ShiftーJIS(SJIS)」ヘッダー区切り記号が「CRLF」となっていることを確認したので、「Next」を選択します。
行区切り記号が「CRLF」、列区切り記号が「コンマ」(カンマ)になっていることができました。
また、1行目のヘッダー行もヘッダーとして認識されています。
「Next」を選択します。
変換先(データの作成先)は「SQL Server Native Client 11.0」を選択します。
サーバー名を確認し、データベースが先ほど作成した「tech_datalake」であることを確認し、「Next」を選択します。
すると、変換先が[dbo].[c03]に設定されます。[スキーマ名].[テーブル名]の形です。
デフォルトファイル名がテーブル名になるので、変更したい場合はダブルクリックして各自修正してください。(手順ではこのままにします)
「Next」を選択します。
「Next」を選択します。
「Finish」を選択します。
「Success」となっているので成功しました。
「Close」を選択します。
テーブルが作成できたことが確認できました。
テーブルの中身を表示する
一番簡単だと思う方法を紹介します。
テーブル名を右クリックして、「上位1000行の選択」を選択します。
すると以下のように、クエリエディタにSQL表示され、クエリの実行結果が1000行表示されました。
SQLについては別途説明しますので、「c03」のデータが1000行表示されたくらいに思っていれば大丈夫です。
次回について
今回はMicrosoft SQL Server Management Studioを使ってみようということで、データベースを作って簡易的なデータの取り込み(テーブル化)と表示するところまで行いました。
次回以降は、SQLを使ってよりデータのの把握をしようと思います。
コメント