Проблема в том, что у вас клип с *переменной* частотой кадров, которая "плавает" в широком диапазоне и, *в среднем*, имеет частоту кадров около сорока. В случае захвата экрана это происходит из-за недостаточной мощности аппарата - он просто "не успевает" одновременно просчитывать и захватывать графику (хотя, частота может плавать и без захвата - если нет значительны лагов мы этого просто не замечаем). В случае записи с камеры телефона такое тоже происходит - при недостатке освещения.
Телефон "умеет" показывать такие ролики "плавно", а вот редакторы видео, которые "привыкли" работать с качественными исходниками с *постоянной* частотой кадров - нет.
Вариант один - перекодировать этот ролик в видео с постоянной частотой кадров. Есть два основных метода это сделать - путём дублирования "недостающих" кадров или полным пересчётом с интерполяцией ("optical flow"). В первом случае видео *может* начать заметно "подёргиваться", второй требует значительных вычислительных ресурсов, времени и, в некоторых случаях, к появлению артефактов.
Как это сделать? Лучше всего используя
FFmpeg или что-то более простое в обращении типа
HandBrake . Есть и другие программы - типа "
формат фактори ", но я ими никогда не пользовался из-за их примитивизма.