Я прохожу серию курсов HarvardX по R, и в Data Science: Visualization в качестве примеров для построения графиков, сравнений и прочего использовались данные организации Gapminder. Они упарываются по статистике как по средству борьбы со стереотипами – и у них много данных по доходам, фертильности и проч. стран “развивающихся” и “развитых”. Они утверждают, что это разделение давно неактуально. На курсе действительно интересно показывается работа с этой статистикой, но меня заинтересовало другое.
Вот график доходов на душу населения по регионам (график увеличивается):
Чтобы было понятно: это сравнение доходов стран по регионам, указанным внизу, за два года – красным показываются доходы за 1970, голубым – за 2010. Доход показывается с помощью прямоугольника-боксплота. Если говорить просто, внутри него отображается медиана, верх – максимальное значение, низ – минимальное, а точки – это отклоняющиеся от общей массы максимумы и минимумы. Такой взгляд значительно лучше описывает ситуацию, чем безликие “средние” значения.
График и так интересный, но меня дико заинтересовало, что это за богатая страна в Центральной Африке, имеющая европейские доходы при полной нищете соседей. Посмотрела в данных – оказывается, это Габон. Вот вы что-нибудь знаете про Габон? Наверняка нет. А там войска комплектуются на добровольной основе, полно бабла от нефти и большая часть людей исповедует христианство. Удивительное дело! Это такой же разрыв шаблона, как когда португальский таксист рассказывал мне, что все таксисты из Португалии едут зарабатывать в Анголу.
Если вас заинтересовал пик для Западной Африки, который уделал даже Габон, то это были туристические Сейшелы, а в Северной Европе всех подвела Латвия.