ببینید : گزارشگری فوتبال توسط هوش مصنوعی GPT-4
برای انجام این کار، هر فریم ویدیو از طریق API به مدل GPT-4 Vision داده شده تا آن را توصیف کند. در قدم بعدی متن خروجی GPT-4 به مدل تبدیل متن به صدای OpenAI داده شده تا این متن را با صدای طبیعی به عنوان گزارشگر تبدیل کند