Kursen avslutas med en individuell projektuppgift där du själv väljer ett datamaterial och på ett pedagogiskt sätt i blogg-format beskriver hur några aspekter av detta material kan illustreras med R. Syftet med uppgiften är att ge dig möjlighet att demonstrera att du hanterar kursverktygen och detta är viktigare än att du hittar något intressant i ditt datamaterial. I omfattning skall projektet ungefär motsvara en av laborationerna 2-4 inklusive bonusuppgifter.
Vid val av datamaterial bör du tänka på följande:
Välj inte data som följer med R-paket, används i undervisnings eller tävligssammanhang. På webbsidor som till exempel Kaggle hittar du mängder av intressanta datamaterial (enligt sidan fler än 50 000), men det finns också mängder av publicerade analyser av dessa material tillgängliga (fler än 400 000). För att minimera risken för fri- eller ofrivilligt plagiat bör ni därför undvika dessa källor.
Välj ett material som är lite utmanande, till exempel består av flera tabeller som behöver kombineras eller är sparat i ett lite knepigt format. Då blir det enklare att visa vad du kan.
Är du osäker, fråga på Discord!
Deadline för färdigt projekt är 29/8, men innan 15/8 vill vi att ni kort beskriver era projektideer i en issue till ert projektbibliotek på GitHub. Vi kommer då återkomma med feedback.
Det färdiga projektet skall publiceras som filen README.md
i ert projektbibliotek (https://github.com/MT3003-ST21/pr_XXX
) med tillhörande datafiler och eventuella skript-filer. Om ni känner er begränsade av .md
-formatet och föredrar .html
, kontakta kursansvarig.