استخراج خودکار داده از فاکتور و رسید با n8n و هوش مصنوعی

اگر با فاکتور، رسید و اسناد مالی زیاد سروکار دارید، احتمالاً بخش زیادی از وقت‌تان صرف وارد کردن دستی اطلاعات در اکسل، Google Sheets یا سیستم حسابداری می‌شود. خطای انسانی، خستگی و حجم بالای سندها باعث می‌شود این کار هم کند باشد و هم پر از اشتباه. با کمک n8n، OCR و هوش مصنوعی (LLM) می‌توانید یک سیستم بسازید که فاکتور و رسید را از تصویر یا PDF بخواند، فیلدهای کلیدی را استخراج کند و به‌صورت خودکار در شیت یا ERP ذخیره کند.

در نتیجه، از یک فرآیند دستی و خسته‌کننده به یک جریان خودکار و هوشمند می‌رسید که همیشه آماده است داده‌های مالی را تمیز و ساختارمند برای شما ثبت کند.

این ورک‌فلو دقیقاً چه کاری انجام می‌دهد؟

سناریوی «استخراج خودکار داده از فاکتور و رسید با n8n و هوش مصنوعی» به طور خلاصه:

  • فاکتور و رسیدها را از ایمیل، آپلود وب‌سایت، پوشه Drive یا تلگرام دریافت می‌کند،
  • با OCR متن داخل تصویر/PDF را استخراج می‌کند،
  • متن خام را برای مدل زبانی می‌فرستد تا فیلدهای مهم را شناسایی و ساختاردهی کند،
  • فیلدهایی مثل شماره فاکتور، تاریخ، نام فروشنده، مجموع، مالیات و… را در قالب JSON برمی‌گرداند،
  • و در نهایت این داده‌ها را در Google Sheets، دیتابیس یا سیستم حسابداری (مثلاً ERP/CRM) ذخیره می‌کند.

می‌توانید این جریان را برای فاکتورهای خرید، هزینه‌های پرسنل، رسیدهای سفر و حتی فیش‌های خدماتی (آب/برق/اینترنت) استفاده کنید.

سناریوهای کاربردی استخراج داده از فاکتور

  • استارتاپ‌ها و کسب‌وکارهای کوچک: ثبت خودکار هزینه‌ها برای گزارش مالی و حسابداری آخر ماه.
  • آژانس‌ها و فریلنسرها: ثبت سریع فاکتورهای مشتریان و هزینه‌های پروژه در شیت یا ابزار مدیریت پروژه.
  • تیم‌های مالی: کم کردن حجم ورود دستی داده و کاهش خطای انسانی در ERP.
  • شرکت‌های سفر و لجستیک: ثبت خودکار رسیدهای هتل، بلیط و سوخت کارمندان.

جریان کلی این ورک‌فلو در n8n

از نظر فنی، این سناریو در n8n معمولاً به چند مرحله ساده تقسیم می‌شود:

  • ۱. دریافت فاکتور یا رسید: ورودی می‌تواند از مسیرهای مختلف باشد:
    • ایمیل مخصوص فاکتور (مثلاً invoices@…)،
    • فرم آپلود در سایت داخلی،
    • پوشه‌ای در Google Drive / Dropbox،
    • یا ارسال عکس فاکتور به بات تلگرام.
    n8n با یک Trigger (ایمیل، Drive، Webhook یا Telegram) هر فایل جدید را دریافت می‌کند.
  • ۲. اجرای OCR روی تصویر یا PDF: فایل دریافتی به یک سرویس OCR (مثلاً Google Vision، Tesseract سرویس‌شده یا API مشابه) ارسال می‌شود و متن خام فاکتور برگردانده می‌شود. این متن ممکن است شلوغ و بدون ساختار باشد.
  • ۳. تمیز کردن متن: با نودهای Function و Set می‌توانید:
    • خطوط خالی، کاراکترهای عجیب و تکرارها را حذف کنید،
    • اگر چند زبان در سند هست، فقط بخش موردنیاز (مثلاً فارسی یا انگلیسی) را نگه دارید،
    • در صورت نیاز، متن را به بخش‌های کوچک‌تر تقسیم کنید.
  • ۴. استخراج فیلدها با هوش مصنوعی: متن آماده به یک مدل زبانی (LLM) مثل OpenAI ارسال می‌شود و Promptی شبیه این به مدل داده می‌شود:
    «این متن یک فاکتور/رسید است. لطفاً فقط در قالب JSON این فیلدها را برگردان: invoice_number, date, vendor_name, total_amount, tax_amount, currency, line_items[…]. اگر چیزی نبود null بگذار.»
  • ۵. پارس JSON و اعتبارسنجی: خروجی مدل به صورت JSON در n8n پارس می‌شود. می‌توانید:
    • مطمئن شوید تاریخ در فرمت درست است،
    • مقدار عددی total_amount معتبر است،
    • در صورت وجود مغایرت (مثلاً جمع آیتم‌ها با مجموع برابر نیست) آن را در یک فیلد جدا ثبت کنید.
  • ۶. ذخیره داده در شیت یا ERP: با نودهای Google Sheets / MySQL / PostgreSQL / ERP API رکورد جدیدی ایجاد می‌شود که شامل همه فیلدهای استخراج‌شده است. اگر از سیستم حسابداری ابری استفاده می‌کنید، می‌توانید مستقیم در آن Invoice Record بسازید.
  • ۷. اطلاع‌رسانی و بازبینی (اختیاری): برای فاکتورهایی که مشکوک هستند (مثلاً مقدار بالا، vendor جدید یا خطای اعتبارسنجی)، با Slack/تلگرام/ایمیل به تیم مالی هشدار می‌دهید تا آن فاکتور را دستی چک کنند.

پیش‌نیازهای راه‌اندازی این سناریو

  • n8n در حال اجرا: روی سرور، Docker، VPS یا n8n Cloud.
  • سرویس OCR: مثل Google Vision، OCR Space یا سرویس مشابه برای تبدیل تصویر/PDF به متن.
  • OpenAI API Key یا مدل LLM مشابه: برای استخراج فیلدها از متن OCR شده.
  • محل ذخیره داده: Google Sheets، دیتابیس یا سیستم حسابداری/ERP.
  • کانال ورودی اسناد: ایمیل، Drive، تلگرام یا فرم آپلود که n8n بتواند به آن دسترسی داشته باشد.

مراحل کلی پیاده‌سازی در n8n

  1. یک Trigger برای دریافت فایل (ایمیل، Drive، Webhook یا Telegram) در n8n راه‌اندازی کنید.
  2. فایل را به سرویس OCR بفرستید و متن خام را دریافت کنید.
  3. با نودهای Function/Set متن را تمیز و برای پردازش آماده کنید.
  4. نود OpenAI را اضافه کنید و Prompt استخراج فیلدها را طوری بنویسید که خروجی JSON برگرداند.
  5. خروجی JSON را پارس کنید و فیلدها را در متغیرهای جدا ذخیره کنید.
  6. با نود Google Sheets / Database / ERP API رکورد جدید فاکتور یا هزینه را ثبت کنید.
  7. برای موارد خاص (مثلاً مبالغ بالا یا فاکتورهای جدید) یک نود Slack/Telegram/Email اضافه کنید تا تیم مالی را نوتیف کنید.
  8. چند فاکتور واقعی را تست کنید، Prompt و منطق اعتبارسنجی را تنظیم کنید و در نهایت ورک‌فلو را برای استفاده روزمره فعال کنید.

چطور این ورک‌فلو را حرفه‌ای‌تر کنیم؟

  • پشتیبانی چند قالب فاکتور: در Prompt مثال‌هایی از قالب‌های مختلف بدهید تا مدل در موقعیت‌های متنوع هم خوب عمل کند.
  • حساب کاربری برای هر کارمند: اگر هر کارمند رسیدهای خودش را می‌فرستد، آن‌ها را با یک شناسه یا ایمیل به رکوردها وصل کنید.
  • سقف هزینه و آلارم: برای هزینه‌های بالاتر از یک حد مشخص، هشدار جداگانه بفرستید.
  • تطبیق با سفارش خرید: در صورت وجود PO Number، فاکتور را با سفارش خرید در سیستم شما مچ کنید.
  • گزارش‌گیری دوره‌ای: با ذخیره داده‌ها در شیت/دیتابیس، گزارش‌های ماهانه از هزینه‌ها و فروشندگان پرتکرار بسازید.

نکات مهم و خطاهای رایج

  • کیفیت OCR به کیفیت تصویر بسیار وابسته است؛ بهتر است از اسکن یا عکس واضح با نور مناسب استفاده شود.
  • هوش مصنوعی ممکن است گاهی فیلدها را اشتباه تشخیص دهد؛ برای مبالغ یا اسناد حساس حتماً یک مرحله بازبینی انسانی در نظر بگیرید.
  • اگر JSON خروجی گاهی خراب است، در Prompt نمونه JSON و قوانین سخت‌گیرانه‌تری برای فرمت خروجی تعریف کنید.
  • در اسناد مالی، حریم خصوصی و امنیت داده بسیار مهم است؛ قبل از ارسال به سرویس‌های خارجی، سیاست‌های سازمان و قوانین محلی را بررسی کنید.

جمع‌بندی

با ورک‌فلو استخراج خودکار داده از فاکتور و رسید با n8n و هوش مصنوعی می‌توانید ثبت هزینه‌ها و فاکتورها را از یک کار دستی و زمان‌بر به یک فرآیند خودکار، سریع و کم‌خطا تبدیل کنید. OCR + LLM + n8n در کنار هم یک دستیار مالی دیجیتال برای شما می‌سازند که هر روز و هر ساعت آماده‌ی پردازش اسناد جدید است.

اگر می‌خواهید تیم مالی یا حسابداری‌تان کمتر درگیر ورود داده و بیشتر درگیر تحلیل و تصمیم‌گیری باشد، این سناریو یکی از بهترین کاربردهای عملی هوش مصنوعی در اتوماسیون مالی است.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد.