Для решения этой задачи необходимо использовать библиотеку для обработки изображений, например, OpenCV. С помощью этой библиотеки можно сравнивать две картинки и определять, насколько они похожи. Если картинки похожи, то можно нажимать на них. Если нет, то можно нажимать на другое место. Для создания интерфейса можно использовать классы java.awt.Button или javax.swing.JFileChooser. В Java также есть возможность рисования изображений с помощью класса
java.awt.Graphics .