Original size 1140x1600

Анализ Google Play

PROTECT STATUS: not protected
3

Описание

На сайте kaggle.com я наткнулась на очень интересные данные, связанные с Google Play store и решила разобрать и проанализировать их подробнее. Мне было интересно узнать, как связаны некоторые факторы с рейтингом и количеством скачиваний приложений. Также было интересно изучить самые популярные категории среди пользователей.

Этапы работы

Выбор оформления и типов графика

При выборе цветов для графиков я опиралась на стиль google play store. (Поэтому я взяла цвета #4285F4, #34A853, #FBBC05, #EA4335)

big
Original size 1200x800

Для анализа данных я выбрала следующие типы графиков: 1. Круговая диаграмма (Процент приложений по категориям от общего количества)

2. Столбчатая диаграмма (Топ категорий по количеству установок)

3. Точечный график (Для визуализации связи меду размером приложения и его рейтингом)

4. Линейный график (Визуализация связи между годом выпуска приложений и их средним рейтингом)

Эти графики наглядно визуализируют все обработанные данные и с первого взгляда на них становятся понятными процентные соотношения по количеству скачиваний, связь с определенными факторами и тд.

Анализ данных

В процессе работы я использовала библиотеки. Pandas был использован для работы с csv-файлом, matplotlib.pyplot использовался мной для визуализации графиков. Также для визуализации я использовала seaborn.

Original size 930x99

Я загрузила данные из csv-файла, удалила строки с пропущенными значениями, которые могли бы помешать анализу, подготовила данные для более удобной последующей работы с ними.

Original size 1105x226

Визуализация данных

Я создала цветовую палитру для графиков, с помощью установки силей добавила на фон графиков сетку, чтобы они более читаемыми, и использовала библиотеку Matplotlib для оформления в стиле 'ggplot'.

Original size 1064x123
Original size 1202x709
Original size 1098x144

Код круговой диаграммы

Исходя из информации с круговой диаграммы можно сделать следующие выводы: Лидирующая категория — Family (29,7%) занимает наибольшую долю приложений в Google Play Store. Это указывает на высокий интерес разработчиков к данной категории приложений.

Game (18,7%) — вторая по популярности категория. Игры составляют значительную часть рынка, что неудивительно, учитывая высокий спрос на мобильные развлечения.

Tools (12,5%) — приложения, связанные с утилитами и инструментами, также пользуются популярностью, поскольку пользователи часто ищут способы оптимизации своих устройств.

Прочие категории (Productivity, Medical, Lifestyle, Photography, Sports, Communication, Finance) занимают меньшую долю, но каждая из них также вносит значимый вклад в общее количество приложений, хоть и не являются предметом высокого спроса среди разработчиков.

Несмотря на то, что в категории «Family» больше всего приложений, это не обязательно означает, что она самая прибыльная или популярная среди пользователей. Высокая конкуренция в крупных категориях требует от разработчиков особого внимания к качеству и уникальности своих продуктов. Для анализа популярности среди пользователей обратимся к следующему графику

Original size 1207x720
Original size 1074x250

Код столбчатой диаграммы

Из данных со столбчатой диаграммы можно сделать следующие выводы: Game и Communication — лидируют по количеству установок, обе категории набрали более 30 миллиардов установок. Это подчеркивает популярность игр и приложений для общения среди пользователей.

Productivity и Social — также имеют высокие показатели, около 15 миллиардов установок каждая, что говорит о востребованности приложений для повышения эффективности и социальных сетей.

Tools и Family — занимают средние позиции по установкам, несмотря на большое количество приложений в категории «Family». Это может указывать на то, что не все приложения из этой категории находят своего пользователя.

Video Players и Travel and Local — имеют наименьшее количество установок среди топ-10 категорий, что может говорить о насыщенности рынка или о меньшем интересе пользователей.

Популярность категории не всегда коррелирует с количеством установок. Например, категория «Family» имеет больше всего приложений, но по установкам уступает «Game» и «Communication». Это говорит о том, что пользователи чаще скачивают игровые и коммуникационные приложения, а не приложения для семьи.

Original size 850x554
Original size 1056x252

Код точечной диаграммы

Из данных с точечной диаграммы становится очевидно: Большинство приложений имеют небольшой размер (до 100 МБ), при этом их рейтинг варьируется от 1 до 5. Множество приложений с низкими рейтингами также находится в этом диапазоне, что может указывать на обилие простых, некачественных или недоработанных бесплатных приложений.

Крупные приложения (более 200 МБ), как правило, имеют более стабильные и высокие рейтинги (от 4.0 и выше), что может свидетельствовать о более высоком качестве контента и ожиданиях пользователей.

Платные приложения (зеленые точки) чаще получают более высокие оценки по сравнению с бесплатными (желтые точки). Это может означать, что пользователи предъявляют более высокие требования к бесплатным приложениям и легче прощают недочеты платным, если они выполняют заявленные функции.

Размер приложения не всегда влияет на рейтинг, но большие приложения чаще имеют более высокий рейтинг, что может быть связано с качеством контента и функционала. Платные приложения также чаще получают высокие оценки, что указывает на разницу в восприятии ценности между бесплатными и платными приложениями.

Original size 1005x554
Original size 1193x305

Код линейного графика

Основные выводы, сделанные исходя из информации с линейного графика: 2010–2012: Резкое падение рейтинга Минимум в 2012 (~3.8), вероятно из-за увеличения количества низкокачественных приложений или слабой модерации. 2013–2016: Стабилизация Восстановление рейтингов (~4.0–4.1) благодаря улучшению качества приложений и чистке магазина. 2016–2018: Устойчивый рост Возможно ужесточение правил Google, развитие технологий и рост требований пользователей привели к повышению качества приложений.

Сначала наблюдался спад качества, но после 2012 года ситуация улучшилась, а с 2016 года средний рейтинг приложений стабильно растёт.

Вывод

Таким образом, изучив все эти данные, можно сделать вывод, что «Game» и «Communication» — самые популярные категории по количеству установок, но по количеству самих приложений лидирует «Family». Высокое количество приложений в категории не гарантирует большого числа установок. Пользователи отдают предпочтение приложениям, которые приносят практическую пользу или развлечение. Платные приложения и приложения большего размера, как правило, имеют более высокие рейтинги, что указывает на важность качества для пользователей. С 2012 года вероятно сильно изменилась политика компании по отношению к разработчикам или усилилась модерация готовых приложений, что в последствии повысило средний рейтинг по годам выпуска. Эти данные могут помочь разработчикам сфокусироваться на создании качественных приложений в популярных категориях, избегая перенасыщенных рынков с низким спросом.

Описание применения генеративной модели

Для создания обложки я использовала нейросеть Leonardo.ai с промтом: «Create a Google-style cover. Use Google’s bright brand colors: blue, red, yellow and green. Draw abstract elements that symbolize data analysis—charts, graphs, trend lines, and application icons. Add smartphone interface elements. Make the background light or with a gentle gradient to make the bright elements stand out.» https://leonardo.ai/

Источники

Google Play Store Apps Web scraped data of 10k Play Store apps for analysing the Android market. https://www.kaggle.com/datasets/lava18/google-play-store-apps

Анализ Google Play
3
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more