Rozpoczęcie pracy z R, czyli tam i z powrotem

Wpis ten nie jest chronologicznie pierwszym na blogu (a chyba powinien być), nie mniej jednak należy przedstawić, jak w ogóle wdrożyć się w pracę z językiem R. Przechodzimy więc do rzeczy.

0 Motywacja używania języka R

Na sam początek, w punkcie zero, warto sobie postawić pytanie, do czego w ogóle przydaje się język R? Jakie praktyczne skutki przyniesie stosowanie go? No więc język R jest przydatny, jeżeli:

  1. pracujemy stale lub często z różnymi typami danych (liczby, tekst, znaki, kombinacje liczb i znaków, wykresy, a nawet mapy), a do tego samych danych wymagających przetworzenia mamy zwykle dużo lub bardzo dużo;
  2. potrzebujemy tworzyć różne tabele z danymi, w których wartości będą oczyszczane, standaryzowane, przeliczane, grupowane, filtrowane, itp. (ogólnie tak zwany Data-Mining lub zwyczajnie po Polsku eksploracja danych);
  3. potrzebujemy wykonywać obliczenia i testy statystyczne, tworzyć modele wyjaśniające pewne zjawiska;
  4. potrzebujemy tworzyć różnego typu wykresy lub interaktywne raporty (Dashboard);
  5. potrzebujemy pobierać dane z baz danych i następnie je modyfikować;
  6. chcemy zacząć zajmować się uczeniem maszynowym, tworzeniem algorytmów z wykorzystaniem sztucznej inteligencji, czyli zagadnieniami z tematyki Data-Science (w tym przypadku inną opcją jest użycie języka Python)
  7. mamy dość czasu i własnej determinacji by nauczyć się nowego języka programowania i konsekwentnie go potem używać.

Jak widać, zastosowań języka R trochę istnieje. Pożytek jaki odniesiemy z używania R to przede wszystkim:

  1. praca stanie się w większym stopniu zautomatyzowana i bardziej wydajna (co będzie oczywiście zależeć od znajomości samego języka, jak również naszej wyobraźni);
  2. zdobędziemy nową pożyteczną umiejętność, co samo w sobie jest już dobre.

Jeżeli wyżej wymienione stwierdzenia nie odpowiadają naszej sytuacji i naszym potrzebom, to język R na nic nam się zda. Jeśli natomiast chcemy zacząć pracę z R, przechodzimy do dalszych rozdziałów tego wpisu.

1 Pobranie i instalacja środowiska języka R

W pierwszej kolejności musimy przede wszystkim pobrać i zainstalować środowisko i interpretator języka R. Plik instalacyjny w wersji R-3.6.2 for Windows 32/64 bit (wersja, przy której powstał ten wpis) ściągamy ze strony https://cran.r-project.org/bin/windows/base/, klikając w odnośnik wskazany na obrazku poniżej.

Rys 1 Strona pobierania aktualnej wersji oficjalnej dystrybucji środowiska programistycznego języka R

Co do samej instalacji, nie ma w niej żadnych niespodzianek, po prostu uruchamiamy instalator i przechodzimy przez cały proces instalacji. Po uruchomieniu środowiska R (dokładnie pliku o nazwie R x64 3.6.2 lub R i386 3.6.2 w zależności od 32- lub 64-bitowej wersji naszego systemu), oczom naszym ukaże się okno jak poniżej:

Rys 2 Okno standardowej konsoli środowiska języka R

Jest to podstawowa konsola (inaczej wiersz poleceń), w której od razu, jeśli chcemy możemy wpisać kod i natychmiast go wykonać, ponieważ R jest językiem interpretowanym, który w porównaniu do języków kompilowanych, nie wymaga kompilacji. Wprowadzamy kod i wciskamy Enter, a interpretator języka wykonuje naszą komendę umieszczoną w linijce. Dla przykładu wykonajmy trzy proste instrukcje, po których w konsoli R widoczny jest wynik naszego działania.

a <- c(1, 2, 3, 4)
b <- c("a", "b", "c", "d")
paste0(a, b)
# "1a" "2b" "3c" "4d"
Rys 3 Wykonanie kodu w konsoli języka R

Konsola jest prosta w użyciu, ale napotykamy problem, gdy chcemy pracować z kodem całościowo w formie skryptu, a nie za każdym razem na nowo go wpisywać i wykonywać.

2 Pobranie i instalacja zintegrowanego środowiska programistycznego RStudio

Ze względu na fakt, że standardowa wbudowana konsola w R jest niezbyt wygodna w użyciu, powstał bardziej rozbudowany edytor kodu nazwany RStudio Desktop. Dostępne są również płatne wersje Desktop oraz Server, ale darmowa dystrybucja w zupełności wystarczy do większości naszych zastosowań. Ściśle rzecz ujmując, RStudio to nic innego jak zintegrowane środowisko programistyczne (IDE). Charakteryzuje się ono przejrzystym i dopracowanym interfejsem graficznym, znacznie ułatwia pisanie skryptów i zarządzanie projektami. Pobieramy wersję instalacyjną ze strony https://rstudio.com/products/rstudio/download/ klikając przycisk z napisem „DOWNLOAD” obok napisu „Free”, a następnie odpowiedni link z wersją systemu operacyjnego, który posiadamy na swoim komputerze, dla przykładu, chcąc pobrać RStudio dla systemu Windows, klikamy w jeden z zaznaczonych linków jak na obrazku poniżej.

Rys 4 Strona pobierania najnowszej oficjalnej dystrybucji zintegrowanego środowiska programistycznego RStudio

Po bezproblemowej instalacji uruchamiamy RStudio i widzimy takie o to okno:

Rys 5 Standardowy widok okna RStudio

Klikamy w File -> New File -> R Script i naszym oczom ukazuje się okienko, gdzie możemy pisać kod w formie skryptu. Napiszmy w Rstudio i wykonajmy ten sam prosty kawałek kodu jak wcześniej w standardowej konsoli.

W przypadku RStudio by wykonać kod napisany w kilku linijkach musimy zastosować kombinację klawiszy Ctrl + Enter w każdej kolejnej linii kodu lub zaznaczyć cały kod i wykonać tą samą kombinację klawiszy tylko raz. Wynik na obrazku poniżej:

Rys 6 Wykonanie kodu w edytorze RStudio

Od razu widać, że RStudio posiada oddzielny obszar do pisania i edytowania kodu oraz oddzielny obszar konsoli, gdzie widzimy natychmiast wynik wykonania kodu. Jest to bardzo dobre rozwiązanie, ponieważ pozwala nam przygotować i dopracować kod, a następnie w całości go wykonać – inaczej niż w standardowej konsoli R. Oczywiście konsoli dołączonej do RStudio możemy używać tak jak tradycyjnej konsoli R – wpisywać i wykonywać tam kod.

Po instalacji R i RStudio posiadamy niezbędne narzędziowe minimum, by móc pisać skrypty i wykorzystywać język R do własnych celów.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *