Picture smart w JAWS wchodzi na wyższy poziom, czyli co raz więcej zastosowań sztucznej inteligencji w czytnikach ekranu

Picture smart, czyli opisywanie obrazów wprowadzono w JAWS już w wersji 2019. Ta funkcja pozwala, w swojej podstawowej wersji ogólnie przekonać się o tym, co znajduje się na obrazie lub zdjęciu, które wskazaliśmy picture smart do opisania. Poprzednie jej wersje polegały na wielu przykładach wcześniej dostarczonych zdjęć i uczeniu się.

Boom na sztuczną inteligencję na szczęście nie ominął też czytnika ekranu. W wersji 2024 wprowadzono ulepszone Picture SMART AI, które korzysta ze sztucznej inteligencji od dwóch producentów.

Jak wiadomo i przed czym ostrzegają wszyscy producenci rozwijający modele AI rozwiązania te mogą dopowiadać sobie również rzeczy, które nie są prawdą, a zatem użycie dwóch odrębnych modeli pozwoli w większości sytuacji wykryć taką konfabulację, na jaką może sobie pozwolić w opisie dla Picture smart którykolwiek z modeli AI. Funkcja ta wychodzi obecnie z programu wczesnego wdrożenia w JAWS i niedługo będzie domyślnym źródłem opisu obrazu dla Picture Smart z JAWS. W wypadku potrzeby skorzystania z poprzedniej wersji picture smart, znanej już od kilku lat, do polecenia picture smart trzeba będzie dodać klawisz Control (CTRL).

Już wtedy można było przekonać się, że przydatne jest opisywanie obrazów czy zdjęć, które nie posiadają tekstu alternatywnego, więc możemy się tylko cieszyć, że sztuczna inteligencja podniesie poziom takich opisów zdecydowanie wyżej, co udowadnia najbardziej znany chyba chat GPT i aplikacje bardziej kierowane do niewidomych jak np. Be My Eyes ze swoim Be My AI opartym na modelu sztucznej inteligencji od Open AI.

Należy się tylko cieszyć z takiego rozwoju sytuacji i czekać na nowe wersje JAWS.

Materiał powstał w ramach projektu  „Niewidomyprogramista.pl – daj szansę niepełnosprawnym na start zawodowy”.