(#04_ENG)_R on the map of programming languages

Well you must be wondering how many users R has, and how it compares to other languages. Red monk has been working on their programming languages rankings for quite some time now, and according to their latest research of January 2015, R ranks 15th (out of 20 programming languages), fiercely battling multipurpose giants such as JavaScript and PHP. The research even notes R having a continuous growth over the past 3 quarters. In order to be ranked in this research, the language must be observable in both Stack Overflow and GitHub.


(#04_MKD)_R на картата на програмски јазици

Сигурно се прашувате точно колку корисници има R, и како тоа се споредува со останатите програмски јазици. Red monk изготвува ранг листи на програмските јазици и според нивното последно истражување од јануари годинава, R се наоѓа на 15тото место (од 20) најпопуларни програмски јазици, храбро борејќи се со повеќенаменските ултрапопуларни јазици како JavaScript и PHP. Истражувањето дури покажува раст на популарноста на R во изминатите три квартали. Сите податоци според кои се врши рангирањето се засноваат врз видливоста која програмските јазици ја имаат и на Stack Overflow и на GitHub.

(#03_ENG)_Tools of the trade

There is a variety of programming languages deemed suitable for data analysis, Phyton for instance represents but one of them, but this blog is solely dedicated to R. So, based on that premise, here are a few software recommendations that are needed to start, but are completely capable for both entry level and advanced analyses, as well as a few guidelines and manuals to get to know these tools of the trade:

    1. Git – http://git-scm.com/downloads  – is a distributed revision control and source code management (SCM) system
    2. GitHub – https://github.com – Web based Git GUI
    3. R – http://cran.r-project.org – R programming language
      • Manuals and tutorials are available under the ‘Manuals’ section of the CRAN website
    4. R Studio – http://www.rstudio.com – free R IDE
    5. Shiny – http://www.rstudio.com/products/shiny – easy web apps for R
    6. R Packages – depending on your needs, you can install various R packages using the R function: install.packages(“PackageName”)
    7. R Tools – collection of tools needed to build packages in R – http://cran.r-project.org/bin/windows/Rtools

And you are all set Happy coding 🙂

(#03_MKD)_Алатки на занаетот

Постојат повеќе јазици кои се соодветни за анализа на податоци, имено Phyton, но овој блог е посветен целосно на R. Затоа, во таа насока, еве препораки за софтвер потребен за почеток, но сосема способен и за почетна и напредна анализа, како и некои упатства за запознавање со алатките на занаетот:

  1. http://git-scm.com/downloads  – Гит е SCM или систем за дистрибуирана контрола на ревизија и менаџмент на изворен код (distributed revision control and source code management (SCM) system)
  2. https://github.com/ – Web базиран GUI за Git
    • Неколку корисни упатства за GitHub – help.github.com
  3. R – http://cran.r-project.org/ – програмскиот јазик R
    • Упатствата можат да се најдат во секцијата ‘Manuals’ на сајтот на CRAN
  4. R Studio – http://www.rstudio.com – бесплатна развојна околина за R
  5. Shiny – http://www.rstudio.com/products/shiny – лесен начин да се креираат веб апликации за R
  6. R Packages – во зависност од вашите потреби, можете да инсталирате повеќе R пакети. За инсталација се користи функцијата: install.packages(“PackageName”)
  7. R Tools – алатки кои се користат за да се креираат пакети во R – http://cran.r-project.org/bin/windows/Rtool

И тоа се основните алатки потребни за работа. Со арно, со убаво куцкањето код 🙂

(#02_eng)_Podatkoteka in Macedonian

Well, after a brief research I discovered that this is no such thing as a blog about R, big data and data science in general in Macedonian. In an attempt to fill in the void, this blog will be bilingual, offering posts in both English and Macedonian. So welcome to Podatkoteka the first bilingual, Macedonian – English blog dealing with these interesting topics. For easier navigation each blog post will be numbered and categorized, and will be offered in both languages. Happy reading 🙂

(#02_mkd)_Податкотека на македонски

По мало истражување увидов дека нема блог на македонски посветен на R, big data и воопшто data science. Во обид да се пополни таа празнина, Податкотека е првиот двојазичен, македонско-англиски блог кој ги опфаќа овие интересни теми. За полесно снаоѓање, само изберете некоја од категориите на македонски јазик. Сите постови се достапни и на македонски и на англиски. Пријатно читање 🙂


Well Hello World indeed 🙂 Thank you for visiting this blog. For years I wanted to start into data science, data mining, exploring vast amounts of data in a structured way that yields some conclusions and results. However I never knew where to start, what software do I need, what formal learning is required, what are the latest scientific journals spearheading the latest developments…
And I finally jumped into the unknown, and since it’s been a huge factor into my off-putting my immersion into the data science, here you go. I decided to start a blog offering a step by step guide into this magnificent realm of data. Hope you enjoy it!