Original size 905x1280

Анализ данных World Development Indicators

PROTECT STATUS: not protected

Для анализа я выбрал данные из открытого источника Всемирного банка, которые содержат информацию о макроэкономических показателях разных стран за последние несколько десятилетий. Датасет называется «World Development Indicators» и доступен для скачивания на официальном сайте Всемирного банка. В нем представлены такие показатели, как:

Внешний долг (External debt stocks, total (DOD, current US$))

Валовой национальный доход (GNI (current US$))

Золотовалютные резервы (Total reserves (includes gold, current US$)).

Эти данные представляют особую ценность, так как позволяют оценить экономическое развитие стран на протяжении длительного периода. Внешний долг, ВНД и резервы — ключевые индикаторы экономической стабильности и потенциала страны. Анализ этих показателей помогает понять, как страны справляются с экономическими кризисами, как меняется их благосостояние и насколько устойчивы их финансовые системы. Я выбрал для анализа четыре страны: Анголу, Бразилию, Китай и Индию. Эти страны представляют разные регионы и уровни экономического развития, что делает анализ более интересным и информативным.

Для визуализации данных я выбрал следующие типы графиков:

Линейные графики: для отображения динамики показателей (внешний долг, ВНД, резервы) по годам. Линейные графики идеально подходят для анализа трендов и изменений во времени.

Столбчатые диаграммы: для сравнения показателей между странами в конкретный год (2022). Этот тип графика позволяет наглядно сравнить значения по разным странам.

Этапы работы

  1. Обработка данных Работа с данными состояла из нескольких этапов:

Загрузка данных: Я использовал библиотеку pandas для загрузки CSV-файла. Данные содержали много лишних столбцов, поэтому я отфильтровал только те, которые относятся к годам и выбранным показателям.

post

import pandas as pd data = pd.read_csv ('API_20_DS2_en_csv_v2_13501.csv', skiprows=4)

Фильтрация данных: Я отобрал только те строки, которые относятся к выбранным показателям (внешний долг, ВНД, резервы) и странам (Ангола, Бразилия, Китай, Индия).

post

indicators = ['External debt stocks, total (DOD, current US$)', 'GNI (current US$)', 'Total reserves (includes gold, current US$)'] filtered_data = data[data['Indicator Name'].isin (indicators)] countries = ['Angola', 'Brazil', 'China', 'India'] selected_data = filtered_data[filtered_data['Country Name'].isin (countries)]

Преобразование данных: Данные были преобразованы из «широкого» формата (где каждый год — отдельный столбец) в «длинный» формат с помощью функции melt. Это позволило удобно строить графики.

post

pivot_data = selected_data.melt (id_vars=['Country Name', 'Indicator Name'], value_vars=year_columns, var_name='Year', value_name='Value')

Очистка данных: Я удалил строки с пропущенными значениями и преобразовал годы в числовой формат.

post

pivot_data = pivot_data.dropna () pivot_data['Year'] = pivot_data['Year'].astype (int)

Использование нейросетей

В процессе работы я использовал нейросеть ChatGPT, чтобы:

Оптимизировать код для построения графиков.

Получить рекомендации по стилизации графиков.

Написать пояснения к этапам работы.

Пример промпта: «Как сделать графики закрашенными и улучшить их читаемость?» Нейросеть предложила использовать plt.fill_between () для закрашивания областей под линиями и настроить прозрачность с помощью параметра alpha.

Стилизация графиков

Для стилизации графиков я использовал библиотеку Seaborn, которая предоставляет удобные инструменты для создания визуально приятных графиков. Я выбрал стиль darkgrid, так как он делает графики более контрастными и читаемыми. Вдохновением для стилизации послужили графики из научных статей и отчетов Всемирного банка, где используется минималистичный дизайн с акцентом на данные.

Original size 855x556

Этот график показывает, как менялся внешний долг выбранных стран с течением времени. Видно, что у Китая и Индии долг растет быстрее, чем у Анголы и Бразилии.

Original size 865x556

Здесь отображен рост валового национального дохода. Китай демонстрирует самый значительный рост, что свидетельствует о его экономическом буме.

Original size 855x556

Этот график показывает изменение золотовалютных резервов. Китай и Индия значительно увеличили свои резервы за последние годы.

Original size 865x556

Столбчатая диаграмма позволяет сравнить внешний долг, ВНД и резервы для каждой страны в 2022 году. Видно, что на момент 2022 года Китай лидирует по всем показателям.

Материалы:

Анализ данных World Development Indicators
Project created at 23.03.2025
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more