Как удалить повторяющиеся слова в Word

Обновлено: 21.11.2024

ранджан Windows 10 Office 2019

Мне нужен макрос для немедленного удаления повторяющихся слов в документах.

Ввод: Заголовок: Заголовок: пожалуйста, используйте осмысленный и конкретный заголовок для описания вашего вопроса.
Вывод: Заголовок : пожалуйста, используйте осмысленный и конкретный заголовок для описания вашего вопроса.

В приведенном выше случае "заголовок" зеленого цвета удаляется только в том случае, если есть следующие или те же самые слова.
Если нет такого же слова, оно остается постоянным, как показано в красном слове «название», и его не нужно нигде менять.
Слово в заголовке "like" представлено в документе три раза, но удалено только в одном месте.

пожалуйста, сделайте необходимое.

Макропод Windows 10 Office 2016

ранджан Windows 10 Office 2019

привет
спасибо за ответ..
но в документе у меня более 100 строк и ручная проверка и замена займет больше времени, если это возможно с помощью одного клика, будет полезнее я.

Макропод Windows 10 Office 2016

С помощью одного шаблона поиска/замены можно удалить все повторяющиеся слова (а также повторяющиеся строки, состоящие из нескольких слов) в документе. Например:
Найти = ( ?@)\1
Заменить = \1

ранджан Windows 10 Office 2019

Он отлично работает, но когда повторяющийся текст был в конце строки, он не заменялся, не могли бы вы изменить текст поиска и замены, это будет более полезно для меня.

Вход: финансовый доход
Выход: финансовый доход
Вход: единица: INR
Выход: единица: INR
Вход: прибыль от продаж
Выход: прибыль от продаж
Вход: доход от прироста
Выход: доход от прироста

ранджан Windows 10 Office 2019

Не могли бы вы просмотреть приведенный выше вариант, есть ли какие-либо изменения в строке FIND для замены с этими условиями.

Исходные данные: финансовый доход
Исходные данные: процентный доход
Исходные данные: прибыль от продаж
Исходные данные: доход доход от прироста прибыли

Выход: финансовый доход
Выход: процентный доход
Выход: прибыль от продаж
Выход: доход от прибыли

Заменены только начальные позиции. Если в конце есть такие же двойные позиции, они не будут заменены.

Найти = ( ?@)\1
Заменить = \1

С помощью приведенной выше команды заменяется только выделенное жирным шрифтом, даже если у нас есть повторяющиеся слова в конце строки.

Стив хранит адреса электронной почты в документе Word. Чтобы найти и удалить повторяющиеся адреса, он должен перенести адреса в книгу Excel. Стив интересуется, есть ли способ удалить дубликаты в Word.

Для целей этого совета я предполагаю, что каждый адрес электронной почты находится в отдельном абзаце, а это означает, что в конце отдельных адресов есть жесткий возврат. Кроме того, адреса указаны в обычном тексте, а не в таблице.

Имея это в виду, следующий макрос может оказаться очень полезным. Он использует два For. Next циклически перемещается по отдельным абзацам документа в обратном направлении. При обнаружении повторяющегося абзаца дубликат удаляется. Макрос не требует сортировки адресов электронной почты.

Обратите внимание, что два абзаца должны быть абсолютно одинаковыми. Если, например, один абзац имеет лишний пробел в начале или в конце, или у одного из них разные заглавные буквы, то они не будут считаться одинаковыми, и один не будет удален. Макрос также работает со всеми абзацами документа, а не только с их частью.

Если вы предпочитаете вариант, который работает только с выделенным текстом, вам подойдет следующее:

Чтобы использовать макрос, просто выберите нужные абзацы и запустите его. Ничто за пределами выбранных вами абзацев не будет изменено.

Сначала я предоставил возможные решения на основе макросов, исходя из того, что удаление дубликатов необходимо выполнять регулярно или в нескольких файлах. По правде говоря, вам не нужно использовать макрос. Вы можете использовать подход, основанный на подстановочных знаках возможностей поиска и замены Word. Выполните следующие действия:

  1. Отсортируйте абзацы, содержащие адреса электронной почты.
  2. Нажмите Ctrl+H, чтобы отобразить вкладку "Заменить" диалогового окна "Найти и заменить".
  3. Нажмите кнопку "Еще", если она доступна.
  4. Убедитесь, что установлен флажок "Использовать подстановочные знаки".
  5. В поле "Найти" введите "(*^13)@" (без кавычек).
  6. В поле "Заменить на" введите "\1" (опять же, без кавычек).
  7. Нажмите "Заменить все".
  8. Закройте диалоговое окно "Найти и заменить".

Это работает благодаря способу настройки шаблона в поле «Найти что» (шаг 5). Первая часть в скобках находит все (звездочка), оканчивающееся жестким возвратом (^13).Вторая часть — это знак @, что означает «найти одно или несколько вхождений упущенного». Таким образом, он находит повторяющиеся абзацы, идущие один за другим. (Вот почему необходим первый шаг, сортировка адресов электронной почты.) Затем они заменяются тем, что было в скобках на шаге 5.

Это может помочь немного лучше объяснить, что происходит. Допустим, после сортировки ваш список адресов электронной почты выглядит так:

Обратите внимание, что я добавил здесь начальные числа только для облегчения объяснения; они не входят в список адресов электронной почты.

Шаблон «Найти что» (*^13)@ будет соответствовать абзацам 2–4, потому что абзац 2, который соответствует части шаблона в скобках, повторяется еще два раза в строках 3 и 4. (Помните, что Символ @ соответствует «одному или нескольким вхождениям вышеизложенного».) Это совпадение из трех абзацев затем заменяется тем, что изначально соответствовало части *^13 шаблона «Найти что», что означает содержимое строки 2. Таким образом, эффект заключается в том, что абзацы 2–4 заменяются абзацем 2, а дубликаты удаляются.

Если вы хотите узнать, как использовать макросы, описанные на этой странице (или на любой другой странице сайтов WordTips), я подготовил специальную страницу, содержащую полезную информацию. Нажмите здесь, чтобы открыть эту специальную страницу в новой вкладке браузера.

Советы по Word — ваш источник недорогого обучения работе с Microsoft Word. (Microsoft Word — самое популярное программное обеспечение для обработки текстов в мире.) Этот совет (13842) относится к Microsoft Word 2007, 2010, 2013, 2016, 2019 и Word в Office 365.

Биография автора

На его счету более 50 научно-популярных книг и множество журнальных статей. Аллен Уайатт является всемирно признанным автором. Он является президентом Sharon Parq Associates, компании, предоставляющей компьютерные и издательские услуги. Узнайте больше об Аллене.

Если вы хотите удалить дубликаты документов Word, вы можете попробовать iBeesoft Duplicate File Finder, чтобы найти их и удалить с умом. Что касается удаления дубликатов в документе Word, вы можете использовать Contrl + F, чтобы найти дубликаты, заменить/удалить их все или удалить их по одному вручную. Ознакомьтесь с подробностями ниже.

"Я писатель и редактор и работаю с текстовыми документами. В последние несколько дней я заметил, что емкость моего ПК уменьшается день ото дня, и это показывает, что на моем диске мало места. Я думаю, на моем компьютере есть дубликаты файлов, которые вызывают это. Есть ли способ удалить дубликаты Microsoft Word?"

Хранилище — это важный фактор в компьютерах, который позволяет пользователям легко и эффективно выполнять свои задачи. Если на вашем компьютере недостаточно места для хранения, вы можете почувствовать, что ваш компьютер работает неэффективно. Существует множество факторов, из-за которых компьютеры могут отображать такие уведомления о нехватке места на диске. Одна из причин — дублирование контента. Как и в предыдущем абзаце, один пользователь выразил обеспокоенность по поводу дублирования документов Microsoft Word. Если вы столкнулись с такой проблемой, прочитайте это полное руководство. Здесь мы расскажем два способа, как удалить дубликаты в документах Word.

Часть 1. Как удалить дубликаты документов Word

Есть 2 способа удалить дубликаты документов Word. Первый метод заключается в использовании такого инструмента, как средство поиска дубликатов iBeesoft, а другой метод заключается в ручном удалении файлов Word. Давайте посмотрим на оба из них, и позже вы сможете выбрать, какой из них лучше для вас. Первый метод является простым и быстрым, в то время как второй требует много времени и ручной работы.

Метод 1. Быстрое удаление повторяющихся файлов Word

Это быстрый способ, и вам не нужно ничего искать самостоятельно, вместо этого мы воспользуемся сторонним инструментом, который сделает все это за нас. iBeesoft Duplicate File Finder — это инструмент, который очень быстро и быстро находит и удаляет повторяющиеся файлы слов. Он не только ограничивается удалением повторяющихся файлов слов, но также может дублировать файлы в видео, изображениях и песнях. Он найдет все повторяющиеся текстовые файлы по размеру, дате и имени.

Лучшее программное обеспечение для удаления повторяющихся копий слов

  • Легкий поиск избыточных файлов. Задайте типы файлов, которые вы хотите сканировать на наличие дубликатов, и удалите их.
  • Удаляйте повторяющиеся файлы одним щелчком мыши. Храните фотографии, видео и документы в упорядоченном виде и экономьте место на диске.
  • Держите компьютерную систему бесперебойной и работающей в идеальном состоянии, удаляя ненужные повторяющиеся файлы.

Пошаговое руководство по быстрому удалению дубликатов документов Word с помощью программного обеспечения

Шаг 1. Загрузите средство поиска дубликатов Microsoft Word

Загрузите средство удаления дубликатов iBeesoft с официального сайта или вы можете загрузить его напрямую, нажав на ссылку здесь. Он будет загружен быстро, так как это очень легкий инструмент размером в несколько МБ.После загрузки установите его на свой компьютер в соответствии с предоставленными инструкциями.

Шаг 2. Найдите повторяющиеся файлы Word

В главном окне нажмите «+», чтобы найти жесткий диск, на котором сохранены дубликаты документов Word. Терпеливо дождитесь окончания сканирования.

Шаг 3. Как удалить повторяющиеся копии Word

После завершения процесса сканирования вы увидите список всех дубликатов файлов, отображаемых на экране вашего компьютера, а также покажет, какие типы файлов занимают место на жестком диске вашего компьютера. Там вы можете легко и быстро выбрать файлы Microsoft Word и нажать «Удалить». Все повторяющиеся файлы Word будут немедленно удалены.

Примечание. Чтобы удалить все дубликаты файлов, вам придется купить лицензию на iBeesoft Duplicate File Finder, иначе в пробной версии будет удалено только 20 дубликатов файлов.

В первом методе мы использовали программное обеспечение для удаления дубликатов файлов, но здесь мы расскажем вам, как вы можете удалить дубликаты файлов Word вручную. Это более медленный и трудоемкий метод, и вы, возможно, не сможете полностью найти все дубликаты файлов. Здесь вам нужно будет найти каждый файл, а затем скопировать его имя и вставить его в строку поиска. После поиска по всему диску он покажет вам, существуют ли какие-либо файлы с таким же именем, размером или датой. Если вы обнаружите какой-либо файл, который является дубликатом, вы можете удалить его, просто нажав кнопку удаления.

Часть 2. Как удалить дубликаты/дубликаты страниц в Word

Здесь, в этой части, вы узнаете, как удалять дубликаты в документах Word. Здесь нет ярлыка, и вам придется выполнять все действия, такие как поиск дублирующегося содержимого в документе, а затем анализировать, действительно ли это дублируется или нет. Предположим, если вы хотите увидеть, есть ли какой-либо абзац, такой как «Быстрая коричневая лиса перепрыгивает через ленивую собаку» в вашем текстовом документе, вам придется скопировать его и нажать «Ctrl + F». Появится текстовое поле поиска, и вам нужно будет вставить туда скопированный контент. Теперь нажмите Enter, и вы увидите те же строки, если они существуют где-либо в документе.

Вы можете легко переписать их или удалить в соответствии с вашими требованиями. Вам придется искать одну за другой каждую строку, а затем выяснять, является ли она дубликатом или нет. Позже вы можете принять меры, например заменить их чем-либо другим или удалить их. Есть еще один способ удалить повторяющийся контент в текстовых документах — использовать макросы. Это сложная задача, и она включает в себя кодирование. Если вы разбираетесь в этом, вы также можете использовать этот метод для удаления дублированного содержимого в документах Microsoft Word. Параметр «Макросы» находится на вкладке «Вид».

Дублирование документов и файлов может привести к нехватке места на вашем компьютере. Если вы хотите удалить дубликаты мировых документов со своего компьютера, мы рекомендуем вам использовать средство поиска дубликатов iBeesoft. Что касается дублированного содержимого в документе Word, вам нужно потратить больше времени на его проверку и удаление или изменение.

Я получил несколько текстовых документов, содержащих тысячи слов (каждое слово в строке). Я уверен, что есть повторяющиеся слова, и мне нужно удалить эти дубликаты и просто остаться одним из них. Я копирую/вставляю все эти слова в документ MS, и теперь мне нужно найти дубликаты и удалить лишние. Находить, а затем удалять по одному скучно и занимает много времени, а некоторые из них могут ускользнуть от моих глаз. Мне нужно программное обеспечение или метод, чтобы сделать это сразу внутри MS Word. Что-то, что ищет все слова и дает мне список результатов, чтобы сказать ему сохранить одно из этих слов и удалить их остальные, чтобы очистить мой список. Я использую MS Word 2019 на Windows 10 x64. Есть ли макрос или простой способ исправить это? Я гуглил и находил старый макрос, но он не работал в MS Word 2019, а также был сложным. Ищете более простой способ или программу с простым пользовательским интерфейсом, чтобы сделать это. Приветствуется бесплатное или пробное программное обеспечение.

2 ответа 2

Если у вас есть Excel, вы можете вместо этого скопировать свой список в электронную таблицу (если в отдельных строках, они должны быть вставлены как отдельная ячейка/строка для каждого слова в одном столбце). Затем вы можете использовать функцию Excel «Удалить дубликаты» (на вкладке «Данные»).

Замечательно, и это сработало! Спасибо "Таня" за этот простой, удобный трюк и Excel нашел около 300 повторяющихся слов, которые нужно удалить. К сожалению, я не смог исправить это с помощью предыдущего решения, которое описал «Xehei», он очень подробно описал, но я не силен в программировании и этом материале, пытался несколько раз, но не получил ответа с помощью PowerShell. характерная черта. Но этот вариант Excel очень прост и быстр.

Для этого можно использовать PowerShell. Чтобы открыть Powershell, используйте Win+R-> введите PowerShell -> Enter; Основная идея состоит в том, чтобы сначала создать пустой массив, а затем проверить, содержит ли массив уже слово, добавить слово в массив, только если массив не содержит слова.

Вы сказали, что каждое слово находится в отдельной строке, тогда это было бы просто сделать с помощью этих кодов:

Обновить в соответствии с комментарием:

Массив — это структура данных, предназначенная для хранения набора элементов. Элементы могут быть одного или разных типов.

[Массив] ([System.Array]) — это тип объектов PowerShell, который представляет собой набор элементов. Массивы можно легко перемещать и управлять ими с помощью команд PowerShell.

Использовать [массив] | get-member -static для получения всех доступных методов для [массива].

Чтобы сделать переменную [массивом], поставьте перед ней [массив];

В первой строке get-content получает содержимое файла, расположенного по адресу "path\to\file\files.txt", и присваивает результат переменной с именемwords, знак доллара $ указывает на строку, следующую за именем Переменная. Переменная является [массивом], потому что перед ней стоит [массив].

Get-Content возвращает каждую строку в виде отдельной строки, поэтому каждая строка будет элементом массива $words.

Вторая команда создает пустой [массив] с именем уникального слова.

В третьей строке foreach ($word in $words) означает для каждого элемента в массиве именованные слова (для каждого элемента, один за другим, по порядку)

Вышеприведенная строка создает [массив] с именем $array с пятью элементами, каждое слово является элементом, элементы являются [string] из-за заключенных в них кавычек. Элементы разделяются запятой.

Попробуйте эту команду:

Это выведет:

Вещи в () — это условие, вещи в <> — это блок сценария (команды, которые должны быть выполнены).

блок сценария оператора foreach,

Это условный оператор if, элементы в () — это условие, элементы в <> — это блок сценария.

-notcontains — это оператор, который означает, что вещь перед ней не содержит вещь после нее (именно то, что указано в ее имени), += — это оператор, который добавляет вещь после нее к вещи перед ней.

Условие if означает, что если $uniquewords не содержит слова, добавить слово в $uniquewords.

Последняя строка выводит содержимое $uniquewords в файл.

Операция foreach гарантирует, что будет обработано каждое слово.

Как заменить путь, замените "path\to\file\files.txt" на полный путь к файлу.

Например, если файл с именем textfile.txt хранится на рабочем столе, то в папке %userprofile%\desktop ваше имя пользователя будет именем пользователя, его полный путь C:\Users\Username\Desktop\textfile.txt

В cmd вы можете использовать %userprofile%\desktop\textfile.txt, чтобы указать полный путь для любого имени пользователя.

В PowerShell используйте вместо этого следующее:

Если вы действительно не являетесь материалом для программирования, каким бы простым он ни был, вы просто не можете его понять, используйте Shift + ПКМ и прокрутите вниз, чтобы найти «Копировать как путь» в контекстном меню, и щелкните его после того, как найдете файл в Проводник и ЛКМ на нем.

Читайте также: