ساخت سری و دیتافریم در کتابخانه پانداس(pandas)

کتابخانه پانداس یکی از کتابخانه های بی نظیر و قدرتمند پایتون است که قابلیت های متعددی برای پیش پردازش و دستکاری داده ها فراهم می کند. در مقاله قبلی سعی کردم مقدمه ای کوتاه از این کتابخانه برایتان بنویسم. در این مقاله قرار است با مباحثی همچون سری و دیتافریم آشنا شویم و ببینیم چگونه می توانیم این ساختارداده ها را در پانداس ایجاد کنیم.

 

سری و دیتافریم در کتابخانه پانداس

قبل از اینکه به سراغ روش های ساخت سری و دیتافریم برویم باید ببینیم این ها چه هستند و چه کارکردی برایمان به ارمغان می آورند. کتابخانه پانداس برای نگهداری از داده ها سه ساختار داده متفاوت دارد: سری(Series، DataFrame و panel). سری که آن را به series هم می شناسند یک آرایه یک بعدی است که می تواند در خود داده هایی همچون اعداد صحیح، اعشاری، استرینگ و حتی object را نگهداری کند. ستون هایی که شما در دیتاست های مختلف دیده اید یک سری هستند. دیتافریم که آن را با عنوان DataFrame نیز می شناسند یک آرایه دو بعدی است. شما می توانید دیتافریم را همانند یک جدول با سطر و ستون تصور کنید( مثل همان جدول هایی که در اکسل دیده اید).

سعی کنید این مبحث را تا جایی که می توانید با دقت یاد بگیرید چون پایه و اساس کار با کتابخانه پانداس است.

چگونه یک سری خالی ایجاد کنیم؟

خوب حالا که می دانیم سری چیست باید دست به کار شویم و شروع به ساخت آن کنیم. برای ساخت یک سری خالی می توانیم از دستور زیر استفاده کنیم:

import pandas as pd

()  ser = pd.Series

print(ser)

 

ساخت سری به کمک آرایه:

برای اینکه بتوانیم با آرایه ها کار کنیم به کتابخانه نامپای نیاز خواهیم داشت. پس قبل از هر کاری این کتابخانه را ایمپورت می کنیم. به کمک دستور np.array یک آرایه می سازیم و سپس آرایه ساخته شده را به سری تبدیل می کنیم.

import pandas as pd

import numpy as np

data = np.array([‘g’, ‘e’, ‘e’, ‘k’, ‘s’])

ser = pd.Series(data)

print(ser)

 

ایجاد سری به کمک آرایه به همراه ایندکس:

اگر دوست دارید سری شما ایندکس داشته باشد باید از دستور زیر استفاده کنید. در ابتدا یک آرایه ساده ایجاد کنید. در گام بعدی داخل پرانتز از عبارت index استفاده کنید و اعدادی که دوست دارید را داخل یک لیست بنویسید. یادتان باشد که به جای اعدادی که من نوشته ام می توانید از موارد دیگر هم استفاده کنید.

import pandas as pd

import numpy as np

data = np.array([‘g’, ‘e’, ‘e’, ‘k’, ‘s’])

ser = pd.Series(data, index =[10, 11, 12, 13, 14])

print(ser)

ایجاد سری به کمک لیست:

اگر یک لیست دارید و می خواهید آن را به سری تبدیل کنید کار سخت و دشواری پیش رو نخواهید داشت. اول لیست تان را بنویسید، بعد آن را به کمک دستوری که در ادامه می بینید به یک سری تبدیل کنید.

import pandas as pd

list = [‘g’, ‘e’, ‘e’, ‘k’, ‘s’]

ser = pd.Series(list)

print(ser)

ایجاد سری از دیکشنری:

پانداس به شما اجازه می دهد از طریق دیکشنری هم شروع به ساخت سری کنید. می پرسید چگونه؟ به کمک دستوری مثل دستور زیر:

import pandas as pd

,dict = {‘Geeks’ : 10

 ,for’ : 20′,

        geeks’ : 30′}

ser = pd.Series(dict)

چگونه در کتابخانه pandas دیتافریم بسازیم؟

تا به اینجای کار سعی کردیم نحوه ساخت سری ها را با هم مرور کنیم. از این بخش به بعد به سراغ دیتافریم ها می رویم و ساخت آن ها را بررسی می کنیم. برای ایجاد یک دیتافریم خالی کافیست کدی مثل کدی که در ادامه می بینید را وارد کنید.

import pandas as pd

()df = pd.DataFrame

ایجاد دیتافریم به کمک لیست:

ساخت دیتافریم با لیست هم کار سخت و طاقت فرسایی نیست. در ابتدا یک لیست بنویسید، بعد از دستور pd.DataFrame برای ساخت دیتافریم از لیستی که ساخته اید استفاده کنید.

import pandas as pd

‘++lst = [‘Java’, ‘Python’, ‘C’, ‘C

        [ ‘JavaScript’, ‘Swift’, ‘Go’

dframe = pd.DataFrame(lst)

print(dframe)

 

ایجاد دیتافریم به کمک دیکشنری:

import pandas as pd

data = {‘Name’: [‘Tom’, ‘Joseph’, ‘Krish’, ‘John’], ‘Age’: [20, 21, 19, 18]}

df = pd.DataFrame(data)

 

استفاده از ایندکس سفارشی به هنگام ساخت دیتافریم:

در روش های بالا خودِ پایتون از روش اندیس گذاری که به طور درون ساخت دارد استفاده می کند. با اینحال شما می توانید هر ایندکسی که دوست داشتید را در Dataframe هایتان استفاده کنید. اگر دنبال یک مثال ساده و کاربردی هستید به طور حتم مثال زیر می تواند برایتان جذاب باشد.

 

import pandas as pd

data = {‘Name’:[‘Renault’, ‘Duster’, ‘Maruti’, ‘Honda City’], ‘Ratings’:[9.0, 8.0, 5.0, 3.0]}

df = pd.DataFrame(data, index =[‘position1’, ‘position2’, ‘position3’, ‘position4’])

 

 

سخن نهایی

ساخت سری و دیتافریم جزء موارد ابتدایی و اصلی کار با کتابخانه پانداس است. اگرچه روش های زیادی برای ساخت این ساختارها وجود دارد اما سعی کردم روش های مهم و کاربردی را در این مقاله معرفی کنم. در مقالات بعدی قرار است با دیتاست های واقعی کار کنیم و هر بار بخشی از دنیای ماشین لرنینگ را کاوش نماییم. قرارمان این است که مباحث را به صورت کاربردی و با مثال های واقعی پیش ببریم. پس ادامه مقالات را از دست ندهید.

2 Comments

به گفتگوی ما بپیوندید و دیدگاه خود را با ما در میان بگذارید.

دیدگاهتان را بنویسید