Original size 779x1120

Самые популярные собаки Америки

PROTECT STATUS: not protected
3

В ходе исследования используется набор данных, содержащий информацию о различных породах собак, стоимости их содержания, размерах, обучаемости, заболеваниях и популярности. Визуализация этих данных позволяет лучше понять распределение цен в зависимости от размера собаки, а также выявить наиболее востребованные породы. С помощью различных типов графиков, таких как коробчатые диаграммы, столбчатые и круговые диаграммы, мы можем не только проанализировать основные тенденции, но и выделить интересные закономерности, которые могут помочь владельцам питомников, потенциальным покупателям и любителям собак.

Для начала посмотрим на данные:

import pandas as pd import matplotlib.pyplot as plt import seaborn as sns

df = pd.read_csv ('./best_in_show.csv') df.head ()

Топ-5 самых популярных собак (где 1 — самая популярная порода)

f['POPULARITY IN US'] = pd.to_numeric (df['POPULARITY IN US'], errors='coerce') df = df.dropna (subset=['POPULARITY IN US']) top_5 = df.nsmallest (5, 'POPULARITY IN US')

plt.figure (figsize=(10,6)) plt.bar (top_5['Dog breed'], top_5['POPULARITY IN US'], color='skyblue') plt.xlabel ('Dogs') plt.ylabel ('Popularity') plt.title ('Top 5 Dogs by Popularity (1 as highest)') plt.gca ().invert_yaxis () plt.show ()

big
Original size 833x547

Соотношение собак и цены их содержания за жизнь в долларах США

df['LIFETIME COST, $'] = df['LIFETIME COST, $'].replace ({'$': '', ', ': ''}, regex=True) df['LIFETIME COST, $'] = pd.to_numeric (df['LIFETIME COST, $'], errors='coerce')

top_10_expensive_breeds = df.nlargest (10, 'LIFETIME COST, $')

plt.figure (figsize=(10,6)) bars = plt.bar (top_10_expensive_breeds['Dog breed'], top_10_expensive_breeds['LIFETIME COST, $'], color='gold', width=0.6)

plt.xlabel ('Dog breed') plt.ylabel ('LIFETIME COST, $') plt.title ('Top 10 Most Expensive Dog Breeds') for bar in bars: height = bar.get_height () plt.text (bar.get_x () + bar.get_width () / 2, height + 50, f"${height:,.0f}», ha='center', va='bottom', fontsize=10)

plt.xticks (rotation=90) plt.show ()

Original size 868x728

Распределение собак в выборке по размерам (маленькие, средние и большие)

size_counts = df['size category'].value_counts ()

plt.figure (figsize=(8, 8)) plt.pie (size_counts, labels=size_counts.index, autopct='%1.1f%%', startangle=90, colors=plt.cm.Paired.colors)

plt.title ('Distribution of Dog Sizes (small, medium, large)')

plt.show ()

Original size 636x658

Соотношение цены содержания собаки с ее размером

plt.figure (figsize=(8, 6)) sns.boxplot (x='size category', y='LIFETIME COST, $', data=df, palette='Set2')

yticks = plt.gca ().get_yticks ()

plt.yticks (yticks[: 3])

plt.title ('Price of Dog by Size (small, medium, large)') plt.xlabel ('Size of Dog') plt.ylabel ('Price (in $)')

plt.show ()

Original size 726x547

Обложка создана в leonardo.ai. Промпт: poster dedicated to dogs and data in size 1140×1600 px without text

Данные взяты на сайте Kaggle: https://www.kaggle.com/datasets/paultimothymooney/best-in-show-data-about-dogs?resource=download

Ссылка на блокнот и датасет: https://drive.google.com/drive/folders/1tCYs_v2oiyYr3lay_a07YJmGPVpj-Jyv?usp=drive_link

Самые популярные собаки Америки
3
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more