The right way of your data vizualization

By Artem Seleznev

Elevator Pitch

We are always having a choice of data visualization ways. Actually, there are two ways: on the one hand, a “fast” visualization way which is supposed to use free or purchased platforms, on the other hand, a “long” way of making your personal platform. Practically, a “long” way most often isn’t long.

Description

We are always having a choice of data visualization ways. Actually, there are two ways: on the one hand, a “fast” visualization way which is supposed to use free or purchased platforms, on the other hand, a “long” way of making your personal platform. But, practically, a “long” way most often isn’t long.

Data visualization is a thing which allows to improve of understanding our data and explaining for customers or leadership. Sometimes it looks like squandered your time and you decide using one of those fascinating platforms presenting at a market and supporting python. You install the first, the second… the 100th and you do find a nessesary platform. After several time you understand that python takes place there only as Flask or Django and you have a huge problem of supporting chosen platform. When you use an alien platform you have a track of finding disadvantages and reminding of your wish of building your own visualization platoform.

Python allows to build amazing things, it goes without saying that data visualization, in particulary for data science projects, is python strong suit.

During speech I’ll take a survey as a research which could respond to questions of python visualition way and give patterns for building your own visualization platform due to python and his libraries.

in Russian:

Когда вы сталкиваетесь с задачей визуализации данных или построением собственной системы визуализации (DashBoard), у вас есть 2 пути:

  • использовать готовый из “коробки” DashBoard;

  • выстроить DashBoard самостоятельно.

Кажется, что первый путь легче и быстрее. Конечно, так как вы увидите первые результаты за несколько шагов, развернув docker container. Или ещё быстрее, если воспользуетесь платными ресурсами: Tableau и подобными. Но если первый путь легче, почему настройка и персонофицирование системы визуализации данных занимает столько же времени, сколько написание собственной системы визуализации.

В своем докладе, я хотел бы рассказать о всех преимуществах реализации собственной DashBoard и почему, именно программист Python может сделать это лучше всего.

Расскажу и приведу примеры:

  • реализация DashBoard на Python+Plotly+Flash (чем эта связка полезнее, чем разворачивать готовое решение (покажу примеры, когда под DashBoard “реализованным на Python”, скрывается JS))

  • как при реализации визуализации можно использовать ETL процесс (как в этом помогает Luigi)

  • как Python программисту прокачать свои навыки работы с БД (у меня в примерах будет PostgreSQL и библиотека SQLAlchemy)

  • постараюсь затронуть тему docker и как при разработки DashBoard можно “прокачаться” в этой технологии

В заключении (немного “боли и хитростей” с профессионального поля деятельности):

  • правильное построение графиков и их реализация при помощи Python (уже в вашей собственной DashBoard), то есть, как отразить график правильно, чтобы он отражал правильные статистические параметры (постараюсь пронести эту тему на фоне основного доклада. Считаю, что будет полезно, особенно тем, кто идет в Python + Data Science)

Notes

I am working as an analytic at a financial company. Everyday I have to explain my decisions to employer and employees but first of all for customers, I do it due to custom visual platform built by our analytic branch. Having used plenty of free to charge and not free platform I believe that the best way is building your platform.