THẢO LUẬN VỀ CÁC TOÁN TỬ DỰA TRÊN LoG ĐỂ PHÁT HIỆN VĂN BẢN THEO THỜI GIAN THỰC
DOI:
https://doi.org/10.51453/2354-1431/2020/426Từ khóa:
Phát hiện văn bản, toán tá» LoG, mô hình Ä‘á»™t quỵ, almost-Gaussian.Tóm tắt
Trong bài báo này trình bày các phương pháp phát hiện văn bản thời gian thực trong hình ảnh dựa trên máy ảnh, tập trung đặc biệt vào toán tử Laplacian of Gaussian (LoG). Các phương pháp này được thảo luận với sự tập trung cụ thể vào các khía cạnh của tính phức tạp và tính mạnh mẽ. Một số kết quả minh họa và các thí nghiệm cơ bản được đưa ra để mô tả đặc điểm của các phương pháp. Hơn nữa, bài báo cũng cung cấp nhận xét về những cải tiến của các phương pháp đối với vấn đề phát hiện văn bản.
Tải xuống
Tài liệu tham khảo
[1] Q. Ye and D. Doermann, "A survey Text detection and recognition in imagery," PAMI, vol. 37.7, pp. 1480-1500, 2015.
[2] R. Gomez and B. Shi, "ICDAR2017 robust reading challenge on COCO-Text," ICDAR, pp. 1435-1443, 2017.
[3] H. Yang and C. Wang, "An Improved System For Real-Time Scene Text Recognition," Proc. Mul., pp. 657-660, 2015.
[4] X. Girones and C. Julia, "Real-Time Text Localization in Natural Scene Images Using a Linear Spatial Filter," ICDAR, pp. 1261-1268, 2017.
[5] S. Deshpande and R. Shriram, "Real time text detection and recognition on hand held objects to assist blind people," Proc. Dyn. Opt. Tech, pp. 1020-1024, 2016.
[6] B. Epshtein, E. Ofek and Y. Wexler, "Detecting text in natural scenes with stroke width transform," CVPR, pp. 2963-2970, 2010.
[7] L. Neumann and J. Matas, "Real-time scene text localization and regconition," CVPR, pp. 3538-3545, 2012.
[8] L. Neumann and J. Matas, "Scene text localization and regconition with oriented stroke detection," ICCV, pp. 97-104, 2013.
[9] L. Gomez and D. Karatzas, "MSER-based real-time text detection and tracking," in ICPR, 2014.
[10] Y. Liu, D. Zhang, Y. Zhang and S. Lin, "Real-time scene text detection based on stroke model," ICPR, pp. 3116-3120, 2014.
[11] J. Matas and L. Neumann, "Real-time lexicon-free scene text localization and recognition," PAMI, vol. 38.9, pp. 1872-1885, 2016.
[12] D. Nguyen, M. Delalandre, D. Conte and T. Pham, "Perfor- mance evaluation of real-time and scale-invariant LoG operators for text detection.," VISAPP, pp. 344-353, 2019.
[13] V. Fragoso, G. Srivastava, A. Nagar, Z. Li, K. Park and M. Turk, "Cascade of Box (CABOX) Filters for Optimal Scale Space Approximation," CVPR, pp. 126-131.
[14] D. Nguyen, M. Delalandre, D. Conte and T. Pham, "Fast RT‐LoG operator for scene text detection," JRTIP, 2020.
[15] H. Kong, H. Akakin and S. Sarma, "A generalized Laplacian of Gaussian filter for blob detection and its applications," Cyber, vol. 43.6, pp. 1719-1733, 2013.
[16] N. Makhfi and O. Bannay, "Scale-space approach for character segmentation in scanned images of arabic document. J. . : 444 (2016)," Theo. App. Infor. Tech, vol. 94.2, 2016.
[17] R. Young, "Gaussian derivative theory of spatial vision: analysis of cortical cell receptive field line-weighting profiles," Motors Research Laboratories, 1985.
[18] W. Ma and M. B.S., "EdgeFlow: a technique for boundary detection and image segmentation," TIP, vol. 9.8, pp. 1375-1388, 2000.
[19] P. Kovesi, "Fast almost-gaussian filtering," Dig. Ima. Comp. Tech, pp. 21-125, 2010.
[20] M. Grabner, H. Grabner and H. Bischof, "Fast approximated SIFT," ACCV, pp. 918-927, 2006.
[21] D. Sen and S. Pal, "Gradient histogram: Thresholding in a region of interest for edge detection," IVC, vol. 28.4, pp. 677-695, 2010.
Tải xuống
Đã Xuất bản
Cách trích dẫn
Số
Chuyên mục
Giấy phép
Tác phẩm này được cấp phép theo Giấy phép Quốc tế Creative Commons Attribution-ShareAlike 4.0 .
Bài báo được xuất bản ở Tạp chí Khoa học Đại học Tân Trào được cấp phép theo giấy phép Ghi công - Chia sẻ tương tự 4.0 Quốc tế (CC BY-SA). Theo đó, các tác giả khác có thể sao chép, chuyển đổi hay phân phối lại các bài báo này với mục đích hợp pháp trên mọi phương tiện, với điều kiện họ trích dẫn tác giả, Tạp chí Khoa học Đại học Tân Trào và đường link đến bản quyền; nêu rõ các thay đổi đã thực hiện và các nghiên cứu đăng lại được tiến hành theo cùng một bản quyền.
Bản quyền bài báo thuộc về các tác giả, không hạn chế số lượng. Tạp chí Khoa học Tân Trào được cấp giấy phép không độc quyền để xuất bản bài báo với tư cách nhà xuất bản nguồn, kèm theo quyền thương mại để in các bài báo cung cấp cho các thư viện và cá nhân.
Mặc dù các điều khoản của giấy phép CC BY-SA không dành cho các tác giả (với tư cách là người giữ bản quyền của bài báo, họ không bị hạn chế về quyền hạn), khi gửi bài tới Tạp chí Khoa học Đại học Tân Trào, tác giả cần đáp ứng quyền của độc giả, và cần cấp quyền cho bên thứ 3 sử dụng bài báo của họ trong phạm vi của giấy phép.