background image

36 

 

 

Figure 21: difficulty distribution in training set

 

 

Figure 22: difficulty distribution in test set 

Specifically, in the training set there are 62,557 records (out of 125,973), or 49.66%, and in 
the test set 10,694 (out of 22,544 records), which amount to 47.44%. Difficulty level 18/21 
follows in both subsets, with a presence of 20,667 (16.41%) and 2,967 (13.16%) respectively.