Является ли это основной причиной, по которой выходные данные softmax обрабатываются этой переменной температуры? При приближении значений друг к другу энтропия увеличивается.