Jalal, Hafiza Dua, Saba Aslam, Muhammad Hasnain Sultan, Ghulam Muhy Ud Deen Raee, Muhammad Azam, and Mubasher Hussain Malik. 2026. “Cross-Modal Knowledge Mining Leveraging Multimodal Large Language Models for Automated Video Scene Understanding and Event Detection”. NextGen AI & Computing Journal 1 (1): 102-31. https://doi.org/10.5281/zenodo.20461727.